OpenAI 周四推出了其最新作品 Sora,号称能够根据简短的文本提示制作令人信服且富有想象力的 60 秒视频。
流行的 ChatGPT 的创建者在一篇博客文章中表示,Sora 能够将文本指令转化为动态的视觉叙事,包括不同的角色、特定的动作和复杂的背景设置。
“该模型不仅掌握了用户提示的本质,而且还理解了这些元素在现实场景中的表现方式,”博客文章补充道。 OpenAI 进一步表示致力于完善这些人工智能模型,旨在帮助个人应对需要切实可行的解决方案的挑战。
“我们正在教人工智能理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。隆重介绍 Sora,我们的文本转视频模型。 Sora 可以生成长达一分钟的视频,同时保持视觉质量并遵守用户的提示。”OpenAI 表示。
该公司还在社交媒体上宣布推出新的人工智能文本到视频生成模型。 OpenAI 在 X(以前称为 Twitter)上的一篇帖子中表示:
“Sora 可以制作长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。”
隆重介绍 Sora,我们的文本转视频模型。
Sora 可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。 https://t.co/7j2JN27M3W
提示:“美丽,白雪皑皑…… pic.twitter.com/ruTEWn87vf
– OpenAI (@OpenAI) 2024 年 2 月 15 日
Sora 标志着 OpenAI 不断努力推进生成人工智能领域的最新进展。 ABI Research 高级分析师 Reece Hayden 表示,虽然“多模态模型”并不完全新颖,而且文本到视频的功能已经存在,但 Sora 的独特之处在于 OpenAI 声称其拥有的长度和准确性。
尽管尚未准备好广泛使用,正如 Altman 在他的帖子中提到的那样,由于需要进行彻底的安全测试并防范潜在的缺陷和滥用,但创始人确实提到,目前它可供一组选定的创作者使用,并计划未来更广泛的可用性。
下面,OpenAI 联合创始人兼首席执行官 Sam Altman 分享了一段展示 Sora 功能的视频。
https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp
— Sam Altman (@sama) 2024 年 2 月 15 日