随着全球短影音领域的竞争日益激烈,YouTube在近日举行的「Made on YouTube」年度发布会上,隆重宣布将推出一系列革新性的生成式AI工具。这些创新功能旨在大幅提升Shorts创作者的内容制作效率与创意空间,其中引人注目的亮点包括专为短影音优化的文字转影片模型Veo 3 Fast、全新的Speech to Song语音转歌曲混音功能,以及能够智能自动生成影片初稿的Edit with AI工具。
YouTube进一步阐述,他们已成功将Google尖端的文字转影片模型Veo 3技术整合到Shorts平台中,并特别为此短影音生态系统打造了专属版本——「Veo 3 Fast」。此版本以其卓越的低延迟输出能力而著称,不仅能迅速生成清晰的480p画质影片,更首次突破性地支持声音生成,让创作者能够以前所未有的速度,创作出带有丰富音效的短片内容。目前,这项强大的功能已在美国、英国、加拿大、澳洲和纽西兰等国家率先上线试用,未来也将逐步推广至全球更多市场,惠及更多创作者。
除了核心的影片生成功能外,Veo技术还为创作者开启了更多富有想象力的玩法。例如,它能巧妙地将视频中的动态元素“移植”到静态图片上,使得照片中的人物仿佛活过来一般,能够随着音乐舞动;此外,创作者还可以轻松为短片应用各种独特的艺术风格,无论是充满活力的波普艺术,还是精致典雅的折纸风格,都能一键实现。甚至,通过简单的文字描述,AI就能智能地为影片添加新的角色或道具,极大地拓展了创作的可能性。

YouTube在周二举行的「Made on YouTube」年度发布会上,正式宣布将推出一系列全新的生成式AI工具,以期全面协助Shorts创作者大幅提升内容制作效率。(图片来源:YouTube)
此次发布会的另一个重要亮点,是全新推出的Speech to Song混音工具。这项功能赋予创作者惊人的能力,能够将影片中的任何对话或口语内容,智能地转换为富有节奏感的音乐音轨,并将其应用于其他Shorts短片中。YouTube产品总监Dina Berrada对此形容道,这项技术能够迅速捕捉一句有趣的对白或一段令人难忘的台词,并将其巧妙地转化成短影音中全新的、极具创意的音乐元素,为内容增添独特的魅力。
这项创新功能的背后,是Google领先的AI音乐生成模型Lyria 2的强大支持。借助Lyria 2,创作者不仅能将语音转化为音乐,还能根据自身的需求,为生成的音乐赋予不同的情感氛围,例如选择“轻松(chill)”、“舞动(danceable)”或“欢乐(fun)”等风格,以精准匹配影片内容。此功能将首先在美国市场启动测试,随后将逐步推广至全球范围内的更多创作者,让他们都能体验AI音乐创作的便捷与乐趣。
此外,对于那些频繁进行拍摄,但却苦于缺乏足够剪辑时间的创作者,YouTube特别推出了「Edit with AI」智能剪辑功能。这项功能能够智能地从用户的相机胶卷中自动筛选出精彩的片段,并巧妙地加入流畅的转场效果、背景音乐以及旁白(目前支持英文和印地语),从而迅速生成一部完整的影片初稿。这极大地简化了初期剪辑的繁琐步骤,创作者可以在此基础上进行更精细的编辑与调整,大幅提升创作效率。
目前,「Edit with AI」功能正在YouTube Shorts平台及其专属的YouTube Create应用程式中进行积极的测试。预计在未来数周内,这项便捷实用的功能将逐步扩展至全球更多的市场,让更多短影音创作者能够体验到AI带来的智能剪辑便利。
综观YouTube此次发布的系列功能,从智能化的短影音自动生成,到创新的AI音乐混音技术,其战略意图显然是直接对标TikTok、Instagram Reels等短影音领域的竞争对手。随着Veo和Lyria等先进的生成式AI模型深度融入内容创作流程,短影音的生产门槛将得到前所未有的降低,这无疑将极大地激发全球创作者的潜力,并可能进一步加速新一轮“全球短影音内容大爆发”的趋势,预示着短影音创作将进入一个全新的高效与高产时代。
