AI 视频的下一个突破:Runway 的 Act-One 功能让角色栩栩如生
自 2022 年底首批 AI 视频模型问世以来,这项技术取得了长足进步,在真实感、分辨率、保真度、提示遵循度(即 AI 模型生成视频与用户输入的文字提示或描述的匹配程度)以及数量方面都有了显著提升。
然而,对于包括我在内的许多 AI 视频创作者来说,一个限制仍然存在:AI 生成角色的逼真面部表情。大多数角色的面部表情显得十分有限,难以控制。
但现在,这一难题终于迎刃而解。总部位于纽约的 AI 初创公司 Runway,获得了 Google 等公司的支持,宣布推出了一项名为“Act-One”的新功能。该功能允许用户使用任何视频摄像头(甚至手机上的摄像头)录制自己的视频或演员的视频,然后将拍摄对象的真实面部表情转移到 AI 生成角色上,并以惊人的准确度实现。
根据 Runway 发布的博客文章,这项免费工具将从今天开始逐步向用户开放。
虽然所有拥有 Runway 账户的用户都可以访问该功能,但它将仅限于拥有足够积分在该公司今年早些时候推出的 Gen-3 Alpha 视频生成模型上生成新视频的用户。Gen-3 Alpha 支持文本转视频、图像转视频和视频转视频的 AI 生成流程(例如,用户可以输入场景描述、上传图像或视频,或者使用这些输入的组合,Gen-3 Alpha 将利用这些信息来指导其生成新场景)。
尽管目前可用性有限,但在线 AI 视频创作者社区已经对这项新功能表示了热烈的欢迎。
Allen T. 在他的 X 账号上评论道:“这将彻底改变游戏规则!”
这一消息也紧随 Runway 上个月进军好莱坞电影制作领域的消息。当时,Runway 宣布与狮门影业(《疾速追杀》和《饥饿游戏》系列电影的制作公司)达成协议,将基于狮门影业超过 20,000 部电影的片库,创建一个定制的 AI 视频生成模型。
传统上,面部动画需要进行大量且繁琐的流程,包括动作捕捉设备、手动面部绑定以及多重参考素材。
任何对电影制作感兴趣的人可能都曾在片场或观看《指环王》系列、《阿凡达》或《猩球崛起》等特效和动作捕捉电影的幕后花絮时,看到过这一过程的复杂性和难度。在这些电影中,演员们身上覆盖着乒乓球标记,脸上点缀着标记,头部还戴着装置。
正如 VentureBeat 之前的一篇报道中所述,正是对复杂面部表情的精确建模,促使大卫·芬奇及其《本杰明·巴顿奇事》的制作团队开发了全新的 3D 建模流程,并最终获得了奥斯卡奖。
然而,在过去几年中,Move 等新软件和 AI 初创公司试图减少进行精确动作捕捉所需的设备。尽管 Move 公司主要专注于全身的更广泛的动作,而 Runway 的 Act-One 则更专注于面部表情的建模。
借助 Act-One,Runway 旨在让这一复杂过程变得更加容易。这项新工具允许创作者以各种风格和设计来动画角色,而无需动作捕捉设备或角色绑定。
相反,用户可以依靠一个简单的驱动视频,将表演(包括视线、微表情和细微的节奏)转移到生成的字符上,甚至可以将表演转移到不同风格的多个字符上。
正如 Runway 在其 X 账号上写道:“Act-One 能够将来自单个输入视频的表演转化到无数不同的角色设计和多种风格中。”
据 Runway 联合创始人兼首席执行官 Cristóbal Valenzuela 在 X 上通过私信回复 VentureBeat 的问题时表示,这项功能“目前”主要集中在面部上。
Runway 的方法为动画师、游戏开发者和电影制作人提供了显著的优势。该模型能够准确地捕捉演员表演的深度,同时在不同的角色设计和比例之间保持通用性。这为创造具有真实情感和个性的独特角色开辟了令人兴奋的可能性。
Act-One 的主要优势之一在于它能够从各种摄像机角度和焦距生成电影级别的逼真输出。
这种灵活性增强了创作者通过角色表演讲述情感共鸣故事的能力,而以前如果没有昂贵的设备和多步骤工作流程,这种能力是难以实现的。
该工具能够忠实地捕捉演员的情感深度和表演风格,即使是在复杂的场景中也是如此。
这种转变使创作者能够以新的方式赋予角色生命,释放了在真人和动画格式中进行更丰富故事讲述的潜力。
虽然 Runway 之前支持视频转视频的 AI 转换,如本文前面提到的,这确实允许用户上传自己的视频,并让 Gen-3 Alpha 或 Runway 之前的其他 AI 视频模型(如 Gen-2)用 AI 效果对其进行“换肤”,但新的 Act-One 功能针对面部映射和效果进行了优化。
正如 Valenzuela 在 X 上通过私信告诉 VentureBeat 的那样:“Act-One 的一致性和性能是无与伦比的。”
赋能更具扩展性的视频叙事
现在,一个演员只需使用一台消费级摄像头,就可以扮演多个角色,而该模型会为每个角色生成不同的输出。
这种能力有望改变叙事内容的创作方式,尤其是在独立电影制作和数字媒体领域,这些领域通常资源有限。
Valenzuela 在 X 上的一篇公开帖子中指出,行业对生成模型的看法正在发生转变。“我们现在已经超越了是否能够生成一致视频的阶段。一个好的模型现在已经成为新的基准。区别在于你如何使用该模型——你如何思考它的应用和用例,以及你最终构建了什么,”Valenzuela 写道。
与 Runway 的所有发布一样,Act-One 配备了一套全面的安全措施。
这些措施包括保护措施,用于检测和阻止未经授权生成包含公众人物内容的尝试,以及用于验证语音使用权的技术工具。
持续监控还确保该平台得到负责任的使用,防止潜在的工具滥用。
Runway 对道德开发的承诺与其更广泛的使命相一致,即扩展创造力,同时始终关注安全和内容审核。
随着 Act-One 的逐步推出,Runway 渴望看到艺术家、电影制作人和其他创作者如何利用这项新工具将他们的想法变为现实。
借助 Act-One,复杂的动画技术现在已触手可及,更广泛的创作者群体能够探索新的叙事形式和艺术表达方式。
通过降低传统上与角色动画相关的技术障碍,该公司希望激发数字媒体领域新的创造力水平。
它还有助于 Runway 在众多竞争对手中脱颖而出,并使其 AI 视频创作平台与众不同,这些竞争对手包括来自美国的 Luma AI,以及来自中国的 Hailuo 和 Kling,以及开源竞争对手,如 Genmo 的 Mochi 1,该模型也于今天发布。