輝達挑戰Meta和谷歌，全新AI模型Fugatto文字生成音頻

NVIDIA 发布全新 AI 模型 Fugatto：用文字生成声音，开启音频创作新纪元

NVIDIA 近日发布了一款名为“Foundational Generative Audio Transformer Opus 1”，简称 Fugatto 的实验性生成式 AI 模型。这款模型能够根据用户提供的文字提示，生成并编辑音频内容，堪称音频领域的革命性突破。

辉达全新AI模型 Fugatto能用文字生成音頻。

Fugatto 的核心目标是打造一个能够像人类一样理解和生成声音的 AI 模型。NVIDIA 应用音频研究经理 Rafael Valle 表示，Fugatto 的诞生是全球 AI 研究人员共同努力的结果，特别是在多口音和多语言处理方面取得了重大进展。

Fugatto 的应用场景十分广泛。音乐制作人可以使用它快速生成歌曲原型，语言学习者可以利用它创建个性化的学习资源，甚至可以用来制作游戏中的音效，为玩家带来更身临其境的体验。

除了音乐和语言学习，Fugatto 在游戏产业中也拥有巨大的潜力。它可以根据玩家的选择生成不同的游戏内预录音效，例如模拟暴风雨的逐渐过渡，为游戏增添更多真实感。

Fugatto 的另一大特色是其能够模拟随时间变化的声音，例如模拟雷阵雨中的鸟鸣声，这使得它在音效设计和视觉艺术等领域拥有更强的应用潜力。

目前，NVIDIA 尚未透露是否会将 Fugatto 向公众开放，但可以预见的是，这款 AI 模型将为音频创作领域带来一场新的革命，为我们打开通往声音世界的大门。

相关内容