OpenAI 发布超逼真 AI 视频生成软件 Sora,开启视频创作新纪元
OpenAI 在今天正式发布了其超逼真 AI 视频生成软件 Sora,距离其在 2024 年 2 月首次公开亮相已近 10 个月。此次发布的 Sora Turbo 版本功能更强大,现已在 sora.com 上面向 ChatGPT Plus 和 Pro 付费用户(每月 20 美元或 200 美元)开放,覆盖美国和除欧盟和英国以外的大多数国家。
OpenAI 联合创始人兼首席执行官 Sam Altman 在 YouTube 直播中宣布了这一消息,这是该公司“OpenAI 的 12 天”系列节日主题公告的一部分,该系列公告于美国东部时间下午 1 点/太平洋时间上午 10 点开始。
Sora 可以根据文本输入或静止图像生成各种视频,创建时长在 10 到 20 秒之间的片段,并支持从 480p 到 1080p 的多种分辨率,以及横向、正方形和纵向等多种纵横比。
OpenAI 为 Sora 打造了全新的独特界面,用户可以在网格视图和列表视图之间切换,查看自己的生成结果。用户还可以进入“故事板”模式,在时间轴视图中生成多个链接的片段。该模型试图在片段之间提供无缝过渡,用户可以拖动以使剪切更加突然,或使拍摄更长、更流畅。
ChatGPT Plus 用户每月可以生成高达 50 个 480p 分辨率的视频。对于专业人士和重度用户,Pro 计划提供更高分辨率、更长时长和无限次生成,但速度较慢。
OpenAI 还宣布计划在 2025 年初发布针对不同用户需求的定制定价方案。
知名科技评论 YouTuber Marques Brownlee(以其用户名 MKHBD 闻名)在发布前约一小时就爆料了 Sora 的发布消息。
“传言是真的——OpenAI 的 AI 视频生成器 SORA 今天向公众发布了……”Brownlee 在社交网络 X 上发帖写道。
Brownlee 还分享了一系列他使用文本/图像/视频到视频生成器制作的视频示例,他作为数十位早期创意合作伙伴之一,在 Sora 正式发布之前获得了早期访问权限。
Brownlee 分享说,虽然 Sora 可以制作令人印象深刻且有时令人毛骨悚然的逼真画面,例如新闻主播或像他这样的电子产品评论员,但它也倾向于幻化出随机细节和 AI 生成的明显迹象,例如新闻字幕中的乱码、不自然的物理现象,甚至随机添加或删除物体。
他还指出,OpenAI 对生成真实人物的肖像以及暴力和露骨主题设置了相当严格的限制。
在完整的 YouTube 评论中,他最终得出结论:“这对人类来说是需要消化很多的东西……[它] 是新的基准,这又一次是它所能达到的最糟糕状态。”
Sora 的发布紧随其后的是,大约两周前,测试人员将 Sora 泄露到 AI 代码共享社区 Hugging Face,以抗议 OpenAI 对测试计划的处理方式。正如泄密者在其 Hugging Face 空间中写道:
“数百位艺术家通过错误测试、反馈和实验工作为价值 1500 亿美元的公司提供无偿劳动。虽然数百人免费贡献,但少数人将通过比赛被选中,他们的 Sora 作品将被放映——提供的微薄报酬与 OpenAI 获得的巨大公关和营销价值相比相形见绌。”
Sora 的到来也正值逼真的真人 AI 视频生成领域竞争日益激烈的时期。Runway 继续快速升级其 AI 视频生成平台,推出新功能,例如上周推出的在现有素材中重新录制对话并使角色面部匹配的功能。Luma AI 和中国的竞争对手,如 Kling、Hailuo 和最近的腾讯,都在过去几周内推出了令人印象深刻的 AI 视频生成工具。
因此,尽管 OpenAI 凭借其在 ChatGPT 和早期引人注目的 Sora 视频方面的成功,可能拥有强大的知名度,这有助于将这款新的 AI 视频生成器推广到大众市场,但现在出现了许多竞争对手,至少在表面上,它们提供了类似或更好的视频质量。这使得 Sora 的成功不再是板上钉钉的事情。