Google DeepMind 发布 Nano Banana 2 Lite 图像模型和 Gemini Omni Flash 视频模型。前者以 4 秒生成、极低成本著称,适合高吞吐场景;后者支持高质量视频生成与对话式编辑。两款模型现已在 Google AI Studio、Gemini API 等平台向开发者开放。
Google DeepMind 近日发布了两款重磅模型——Nano Banana 2 Lite 和 Gemini Omni Flash,旨在加速创意迭代、降低开发门槛。


Nano Banana 2 Lite(gemini-3.1-flash-lite-image)专为快速构思和高并发开发场景设计,在速度和成本上做到极致。官方建议使用第一代 Nano Banana(gemini-2.5-flash-image)的开发者立即迁移,可即刻获得性能提升。
性能基准测试显示,Nano Banana 2 和 2 Lite 在与竞品的对比中,在生成/编辑质量(Elo 评分)、处理延迟、每张 1K 分辨率图像成本等方面均有显著优势。
Nano Banana 2 Lite 突出特点:
尽管追求速度,该模型仍保持可靠的提示词遵循能力、角色一致性以及清晰的文字渲染。
更多功能和集成方法请参考开发者文档。
Nano Banana 2 Lite 也已登陆 Google 消费者端,包括 AI Mode(搜索)、Gemini 应用、NotebookLM、Google Photos、Stitch、Google Flow 和 Google Ads。
Google I/O 上亮相的 Gemini Omni Flash(gemini-omni-flash-preview)如今正式向开发者开放。该模型原生支持文本、图像、视频等多模态输入,可进行高质量视频生成和对话式编辑,定价为每秒 $0.10,与 Veo 3.1 Fast 一致。
Omni Flash 优势:
完整基准测试信息请访问 Google DeepMind 官网。
当前限制:
Gemini Omni 即日起在 Google AI Studio 和 Gemini API 公开预览,更多功能及区域限制见开发者文档。
两个模型可形成强大工作流:先用 Nano Banana 2 Lite 高速生成图像,再将图像作为参考传给 Gemini Omni Flash 生成动画或高质量视频。通过 Interactions API 保持会话上下文,用户可连续执行最多三次编辑。
Google 提供了三个演示应用帮助开发者快速上手:
两个模型均使用 SynthID 水印技术,用户可通过 Gemini 应用、Chrome 或搜索验证 AI 内容。Google 正在扩展内容验证工具,帮助识别网络上的 AI 生成与编辑内容。了解更多
Nano Banana 2 Lite 资源:
Gemini Omni Flash 资源:
原文链接:Google DeepMind
本文由前途科技编辑整理
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断