NVIDIA 发布全新 AI 模型 Fugatto:用文字生成声音,开启音频创作新纪元
NVIDIA 近日发布了一款名为“Foundational Generative Audio Transformer Opus 1”,简称 Fugatto 的实验性生成式 AI 模型。这款模型能够根据用户提供的文字提示,生成并编辑音频内容,堪称音频领域的革命性突破。
Fugatto 的核心目标是打造一个能够像人类一样理解和生成声音的 AI 模型。NVIDIA 应用音频研究经理 Rafael Valle 表示,Fugatto 的诞生是全球 AI 研究人员共同努力的结果,特别是在多口音和多语言处理方面取得了重大进展。
Fugatto 的应用场景十分广泛。音乐制作人可以使用它快速生成歌曲原型,语言学习者可以利用它创建个性化的学习资源,甚至可以用来制作游戏中的音效,为玩家带来更身临其境的体验。
除了音乐和语言学习,Fugatto 在游戏产业中也拥有巨大的潜力。它可以根据玩家的选择生成不同的游戏内预录音效,例如模拟暴风雨的逐渐过渡,为游戏增添更多真实感。
Fugatto 的另一大特色是其能够模拟随时间变化的声音,例如模拟雷阵雨中的鸟鸣声,这使得它在音效设计和视觉艺术等领域拥有更强的应用潜力。
目前,NVIDIA 尚未透露是否会将 Fugatto 向公众开放,但可以预见的是,这款 AI 模型将为音频创作领域带来一场新的革命,为我们打开通往声音世界的大门。