
在人工智能视频生成的竞技场上,一场现实版的“大卫对战歌利亚”正在上演。初创公司Runway凭借其最新发布的Gen 4.5模型,在一项独立的视频生成基准测试中拔得头筹,超越了科技巨头Alphabet(谷歌母公司)和OpenAI的模型。
总部位于纽约、仅有约100名员工的Runway,本周一正式推出了Gen 4.5。该模型在由Artificial Analysis维护的“视频竞技场”排行榜上位列第一,将谷歌的Veo 3模型挤到了第二位,而OpenAI的Sora 2 Pro模型则排名第七。这一成绩标志着资源有限的初创公司在与行业巨头的竞争中取得了显著突破。
Gen 4.5是一个文生视频模型,能够根据文本提示生成高清视频片段。据Runway介绍,该模型在理解物理规律、人体运动以及摄像机动态方面表现卓越。“视频竞技场”的排名通过盲测比较得出:用户在不清楚视频由哪家公司生成的情况下,投票选出他们更偏爱的输出结果,从而确保了排名的客观性。
Runway的首席执行官克里斯托瓦尔·巴伦苏埃拉向媒体透露,团队特意将该项目内部代号命名为“大卫”,正是引用了圣经中大卫以弱胜强击败巨人歌利亚的故事。他表示:“我们凭借一支百人团队,成功超越了市值万亿美元的公司。这证明,只要保持极度的专注和勤奋,就能开拓新的前沿领域。”
此次登顶对这家初创公司而言意义重大。Runway成立于2018年,今年4月刚刚从英伟达、软银、富达投资和泛大西洋投资集团等投资者处筹集了3.08亿美元资金,估值达到30亿美元。据PitchBook数据,其当前估值已升至约35.5亿美元。
在Artificial Analysis的基准测试中,Gen 4.5目前获得了1247的Elo评分。该模型将于本周末前逐步向所有Runway客户开放,用户可通过公司平台、API以及合作伙伴集成进行访问。巴伦苏埃拉指出,此次发布仅是公司计划中一系列重大产品推出的第一步。
尽管取得了显著进展,Runway也坦承Gen 4.5仍存在一些局限性,例如在物体恒存性和因果推理方面尚有不足——这些是当前视频生成模型的普遍挑战,有时会导致“果”先于“因”出现的反常现象。然而,此次在权威盲测中击败巨头,无疑为AI视频领域的技术竞争格局增添了新的变数。
