MIT Technology Review 的「如何」系列旨在帮助您完成任务。
OpenAI 在其为期 12 天的科技发布和演示活动“Shipmas”的第五天,向公众发布了其视频生成模型 Sora。以下是您需要了解的内容,以及如何立即使用该视频模型。
Sora 是什么?
Sora 是一款强大的 AI 视频生成模型,可以根据文本提示创建视频,为图像制作动画,或以新的风格重新组合视频。OpenAI 在 2 月份首次预览了该模型,但今天是该公司首次将其发布供更广泛使用。
这次发布有什么新内容?
Sora 的核心功能——使用简单的提示创建令人印象深刻的视频——与 2 月份预览的内容类似,但 OpenAI 在这次更广泛的发布之前努力使该模型更快、更便宜。有一些新功能,其中两个最突出。
一个是“故事板”。使用它,您可以创建多个 AI 生成的视频,然后将它们按时间顺序组合在一起,就像使用 Adobe Premiere Pro 等传统视频编辑器一样。
第二个是充当创意画廊的提要。OpenAI 表示,用户可以将他们使用 Sora 生成的视频发布到提要中,查看某些视频背后的提示,调整它们,并从中获得灵感。
您可以用它做些什么?
您可以根据文本提示生成视频,更改视频的风格,并使用名为“Remix”的工具更改元素,以及使用“故事板”将多个片段组合在一起。Sora 还提供可以应用于视频的预设风格,例如阴郁的黑色电影或纸板和纸艺,这会营造出定格动画的感觉。您还可以修剪和循环播放您制作的视频。
谁可以使用它?
要使用 Sora 生成视频,您需要订阅 OpenAI 的高级计划之一——ChatGPT Plus(每月 20 美元)或 ChatGPT Pro(每月 200 美元)。两种订阅都包含对其他 OpenAI 产品的访问权限。拥有 ChatGPT Plus 订阅的用户可以使用高达 720p 分辨率的视频生成长达 5 秒的视频。此计划允许您每月创建 50 个视频。
拥有 ChatGPT Pro 订阅的用户可以生成更长、更高分辨率的视频,最高分辨率为 1080p,时长为 20 秒。他们还可以让 Sora 从单个提示中生成多达 5 个视频变体,从而可以更快地查看选项。Pro 用户每月最多可以创建 500 个视频,但也可以创建无限数量的“轻松”视频,这些视频不会立即生成,而是排队等待网站流量较低时生成。
两种订阅级别都允许以三种纵横比创建视频:纵向、横向和正方形。
如果您没有订阅,您只能查看 Sora 生成的视频提要。
OpenAI 今天开始在全球范围内推出 Sora,但该公司表示,它将在“欧洲大部分地区”推出需要更长时间。
在哪里可以访问它?
OpenAI 已将 Sora 从 ChatGPT 中分离出来。要访问它,请访问 Sora.com 并使用您的 ChatGPT Plus 或 Pro 帐户登录。(MIT Technology Review 在发稿时无法访问该网站——网站上的一则说明指出,注册已暂停,因为他们“目前正在经历大量流量”。)
我们是如何走到这一步的?
自 OpenAI 在 2 月份首次推出 Sora 以来,已经发生了一些事情。其他科技公司也推出了视频生成工具,例如 Meta Movie Gen 和 Google Veo。也出现了很多反对的声音。例如,一些艺术家在早期获得了使用 Sora 进行实验的机会,他们泄露了该工具,以抗议 OpenAI 在未经补偿的情况下使用艺术家作品对其进行训练的方式。
下一步是什么?
与任何新发布的模型一样,OpenAI 采取了哪些措施来防止 Sora 被用于恶意、非法或不道德的目的,例如创建深度伪造,还有待观察。关于审核和安全问题,OpenAI 的一名员工表示,他们“可能无法在第一天就做到完美”。
另一个悬而未决的问题是,Sora 每次创建视频时会消耗多少计算能力和能源。生成视频比在 ChatGPT 等工具中生成典型的文本响应需要更多计算时间,因此也需要更多能源。人工智能热潮已经成为能源消耗大户,给旨在减少排放的科技公司带来了挑战,Sora 和其他类似视频模型的广泛可用性可能会加剧这个问题。