在Google I/O 2026上,Google推出Gemini Omni系列,首个模型Omni Flash支持10秒视频生成与编辑,具备真实世界知识,面向订阅用户开放,并扩展SynthID水印至Chrome和搜索。
Google在I/O 2026大会上发布了Gemini Omni,一款全新的生成式AI模型系列,能够根据文本、图像、音频和视频输入生成和编辑视频。这标志着Google在多模态内容创作领域迈出了最具雄心的步伐。

Gemini Omni在加州山景城Shoreline Amphitheatre举办的I/O主题演讲中亮相。Google将其描述为超越传统文本到视频工具(如现有的Veo模型)的一步。Google DeepMind CEO Demis Hassabis称,Omni是通向“能够从任何输入创建任何内容”的系统的一步。
该系列的首个模型Gemini Omni Flash可生成最长10秒的视频片段,并包含音频。据The Verge报道,该媒体采访了Google DeepMind高级研究总监Dumitru Erhan。与Veo不同,Omni Flash以现有视频为基础创建新视频,并允许用户通过对话方式编辑生成或录制的视频——更改背景、角度、场景或其中的具体细节。
Google表示,该模型利用Gemini的“现实世界知识”生成视频,物理准确性和上下文理解能力得到提升,还能理解提示中的历史或文化背景。
Gemini Omni Flash从周二起向Google AI Plus、Pro和Ultra订阅用户开放,可在Gemini应用和Google Flow中使用。据Mashable报道,本周晚些时候,它将免费在YouTube Shorts和YouTube Create应用中上线。开发者API访问权限尚未公布具体时间表。
Google还宣布了重组后的AI Ultra套餐,每月100美元起,提供更高的使用上限;原250美元套餐降至200美元。
所有使用Omni制作的视频都将带有Google DeepMind的SynthID水印,这是一种不可见的标记,用于标识AI生成的内容。同时,Google将SynthID检测扩展到Chrome和搜索,使“圈选搜索”和“Lens”等工具能够标记AI生成的内容。
据The Verge报道,除了自家产品,Google还宣布OpenAI、Kakao、Nvidia和ElevenLabs已承诺在其AI生成内容中采用SynthID技术。Google未给出具体时间表。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断