Stable Diffusion 背后的初创公司 Runway 发布了一种新的 AI 模型,可以从文本生成视频

Stable Diffusion 背后的初创公司 Runway 发布了一种新的 AI 模型,可以从文本生成视频

AI 图像生成器的使用可以追溯到 1990 年代初期,当时艺术家们开始使用 AI 算法来生成艺术、音乐和视觉效果。 2021年,OpenAI开发的基于神经网络的图像生成模型DALL-E2的推出,进一步带动了AI图像生成器的主流采用。

如今,用于图像和视频合成的 AI 系统的精度、真实性和可控性正在迅速提高。 Stable Diffusion 是最受欢迎的 AI 图像生成器之一,这是一种深度学习文本到图像模型,现在可以让数十亿人根据文本描述在几秒钟内创作出令人惊叹的艺术作品。

今天,Stable Diffusion AI 图像生成器背后的初创公司之一 Runway 宣布发布名为 Gen-2 的 AI 模型,它可以接受任何文本描述——例如“天空中飞翔的乌龟”——并生成三秒钟的匹配录像。

根据其网站,Gen-2 是一个多模式人工智能系统,可以生成带有文本、图像或视频剪辑的新颖视频。

https://d3phaj0sisr2ct.cloudfront.net/research/gen1/videos/newyork/newyorkapt.webm

出于安全和商业方面的考虑,Runway 决定此时不广泛发布该模型,也不会像 Stable Diffusion 那样开源。最初,文本转视频模型只能通过 Runway 网站上的候补名单和 Discord 访问。

https://d3phaj0sisr2ct.cloudfront.net/research/gen1/videos/scuba/scuba_generated.webm

虽然使用人工智能从文本输入生成视频并不是一个新概念,但去年 Meta Platforms 和谷歌都发表了关于文本到视频人工智能模型的研究论文。然而,根据 Runway 的联合创始人兼首席执行官克里斯托瓦尔·瓦伦苏埃拉 (Cristobal Valenzuela) 的说法,让 Runway 与众不同的是,其文本到视频的 AI 模型将可供公众使用。

本文来自互联网,不代表前途科技立场,如若转载,请注明出处:https://accesspath.com/tech/5825527/

(2)
定国的头像定国
上一篇 2023年3月21日 上午6:00
下一篇 2023年3月21日 上午6:41

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注