Google DeepMind 推出图像与视频生成新模型

Google DeepMind 近日发布了两款重磅模型——Nano Banana 2 Lite 和 Gemini Omni Flash，旨在加速创意迭代、降低开发门槛。

Alisa Fortin
anish

Nano Banana 2 Lite：最快、最经济的 Gemini 图像模型

Nano Banana 2 Lite（gemini-3.1-flash-lite-image）专为快速构思和高并发开发场景设计，在速度和成本上做到极致。官方建议使用第一代 Nano Banana（gemini-2.5-flash-image）的开发者立即迁移，可即刻获得性能提升。

性能基准测试显示，Nano Banana 2 和 2 Lite 在与竞品的对比中，在生成/编辑质量（Elo 评分）、处理延迟、每张 1K 分辨率图像成本等方面均有显著优势。

Nano Banana 2 Lite 突出特点：

低延迟：文本转图像仅需 4 秒，适合交互式原型设计和快速视觉草图。
成本效益：每张 1K 图像仅 $0.034，大幅降低运营成本。

尽管追求速度，该模型仍保持可靠的提示词遵循能力、角色一致性以及清晰的文字渲染。

Nano Banana 系列概览

Nano Banana 2 Lite（Gemini 3.1 Flash Lite Image）：速度优先，适合近实时、高吞吐量的工作流。
Nano Banana 2（Gemini 3.1 Flash Image）：通用主力，质量与延迟均衡，性价比最高。
Nano Banana Pro（Gemini 3 Pro Image）：针对复杂专业场景，提供最强控制和高级推理能力。
Nano Banana（Gemini 2.5 Flash Image）：旧版模型，建议升级至 2 Lite。

更多功能和集成方法请参考开发者文档。

Nano Banana 2 Lite 也已登陆 Google 消费者端，包括 AI Mode（搜索）、Gemini 应用、NotebookLM、Google Photos、Stitch、Google Flow 和 Google Ads。

Gemini Omni Flash：高质量、低成本的视频生成与编辑

视频演示

Google I/O 上亮相的 Gemini Omni Flash（gemini-omni-flash-preview）如今正式向开发者开放。该模型原生支持文本、图像、视频等多模态输入，可进行高质量视频生成和对话式编辑，定价为每秒 $0.10，与 Veo 3.1 Fast 一致。

Omni Flash 优势：

对话式视频编辑：用自然语言调整和编辑视频。
多模态参考：结合图片、文本和视频，保持场景一致性与控制力。
现实世界知识：利用 Gemini 的历史、生物学、叙事逻辑等知识构建有说服力的视频。
文字与动作同步：通过简单提示，将文本和图形直接关联到视频动作。

完整基准测试信息请访问 Google DeepMind 官网。

当前限制：

单次生成最长 10 秒视频（更长时长即将支持）。
Gemini API 暂不支持上传音频参考和场景扩展。
API schema 接受最长 3 秒的视频参考，但当前模型处理不完善。
场景切换或镜头移动时角色一致性存在局限，团队正在改进。

Gemini Omni 即日起在 Google AI Studio 和 Gemini API 公开预览，更多功能及区域限制见开发者文档。

组合使用：从图像到视频的无缝衔接

两个模型可形成强大工作流：先用 Nano Banana 2 Lite 高速生成图像，再将图像作为参考传给 Gemini Omni Flash 生成动画或高质量视频。通过 Interactions API 保持会话上下文，用户可连续执行最多三次编辑。

Google 提供了三个演示应用帮助开发者快速上手：

Anywhere：上传自拍或照片，Nano Banana 2 Lite 可瞬间将你“传送”到世界地标，点击图像后由 Omni Flash 生成动画短片。
Space Lift：上传室内照片，自动生成不同风格的设计方案，点击视频按钮即可观看 Omni 渲染的动感效果。
Omni product studio：将 Nano Banana 2 Lite 生成的静态商品图转为影院级电商视频。

安全与透明度

两个模型均使用 SynthID 水印技术，用户可通过 Gemini 应用、Chrome 或搜索验证 AI 内容。Google 正在扩展内容验证工具，帮助识别网络上的 AI 生成与编辑内容。了解更多

立即开始

Nano Banana 2 Lite 资源：

在 Google AI Studio 中实验模型。
查看 Gemini API 文档。
参考提示词指南。

Gemini Omni Flash 资源：

在 Google AI Studio 中实验模型。
查看 Gemini API 文档。
参考提示词指南。

原文链接：Google DeepMind
本文由前途科技编辑整理

Google DeepMind 近日发布了两款重磅模型——Nano Banana 2 Lite 和 Gemini Omni Flash，旨在加速创意迭代、降低开发门槛。

Alisa Fortin
anish

Video 8

Nano Banana 2 Lite：最快、最经济的 Gemini 图像模型

性能基准测试显示，Nano Banana 2 和 2 Lite 在与竞品的对比中，在生成/编辑质量（Elo 评分）、处理延迟、每张 1K 分辨率图像成本等方面均有显著优势。

Nano Banana 2 Lite 突出特点：

低延迟：文本转图像仅需 4 秒，适合交互式原型设计和快速视觉草图。
成本效益：每张 1K 图像仅 $0.034，大幅降低运营成本。

尽管追求速度，该模型仍保持可靠的提示词遵循能力、角色一致性以及清晰的文字渲染。

Nano Banana 系列概览

Nano Banana 2 Lite（Gemini 3.1 Flash Lite Image）：速度优先，适合近实时、高吞吐量的工作流。
Nano Banana 2（Gemini 3.1 Flash Image）：通用主力，质量与延迟均衡，性价比最高。
Nano Banana Pro（Gemini 3 Pro Image）：针对复杂专业场景，提供最强控制和高级推理能力。
Nano Banana（Gemini 2.5 Flash Image）：旧版模型，建议升级至 2 Lite。

更多功能和集成方法请参考开发者文档。

Nano Banana 2 Lite 也已登陆 Google 消费者端，包括 AI Mode（搜索）、Gemini 应用、NotebookLM、Google Photos、Stitch、Google Flow 和 Google Ads。

Gemini Omni Flash：高质量、低成本的视频生成与编辑

视频演示

Omni Flash 优势：

对话式视频编辑：用自然语言调整和编辑视频。
多模态参考：结合图片、文本和视频，保持场景一致性与控制力。
现实世界知识：利用 Gemini 的历史、生物学、叙事逻辑等知识构建有说服力的视频。
文字与动作同步：通过简单提示，将文本和图形直接关联到视频动作。

完整基准测试信息请访问 Google DeepMind 官网。

当前限制：

单次生成最长 10 秒视频（更长时长即将支持）。
Gemini API 暂不支持上传音频参考和场景扩展。
API schema 接受最长 3 秒的视频参考，但当前模型处理不完善。
场景切换或镜头移动时角色一致性存在局限，团队正在改进。

Gemini Omni 即日起在 Google AI Studio 和 Gemini API 公开预览，更多功能及区域限制见开发者文档。

组合使用：从图像到视频的无缝衔接

Google 提供了三个演示应用帮助开发者快速上手：

Anywhere：上传自拍或照片，Nano Banana 2 Lite 可瞬间将你“传送”到世界地标，点击图像后由 Omni Flash 生成动画短片。
Space Lift：上传室内照片，自动生成不同风格的设计方案，点击视频按钮即可观看 Omni 渲染的动感效果。
Omni product studio：将 Nano Banana 2 Lite 生成的静态商品图转为影院级电商视频。

安全与透明度

立即开始

Nano Banana 2 Lite 资源：

在 Google AI Studio 中实验模型。
查看 Gemini API 文档。
参考提示词指南。

Gemini Omni Flash 资源：

在 Google AI Studio 中实验模型。
查看 Gemini API 文档。
参考提示词指南。

原文链接：Google DeepMind
本文由前途科技编辑整理

Google DeepMind 推出图像与视频生成新模型

Nano Banana 2 Lite：最快、最经济的 Gemini 图像模型

Nano Banana 系列概览

Gemini Omni Flash：高质量、低成本的视频生成与编辑

组合使用：从图像到视频的无缝衔接

安全与透明度

立即开始

想了解 AI 如何助力您的企业？

24小时热榜

CERN关闭大型强子对撞机进行15亿美元升级

塔塔电子遭勒索，iPhone 18 Pro 数据泄露

预览 GPT-5.6 Sol：新一代模型

MIT发现磁场增强的石墨烯超导态

Anthropic 发布 Claude Sonnet 5，智能体能力显著提升

一个姿态检测项目的踩坑实录

OpenAI用流行病学方法修复18年C++漏洞

OpenAI发布GeneBench-Pro：评估AI科研判断力新基准

免费获取 AI 落地指南

Google DeepMind 推出图像与视频生成新模型

Nano Banana 2 Lite：最快、最经济的 Gemini 图像模型

Nano Banana 系列概览

Gemini Omni Flash：高质量、低成本的视频生成与编辑

组合使用：从图像到视频的无缝衔接

安全与透明度

立即开始

想了解 AI 如何助力您的企业？

24小时热榜

CERN关闭大型强子对撞机进行15亿美元升级

塔塔电子遭勒索，iPhone 18 Pro 数据泄露

预览 GPT-5.6 Sol：新一代模型

MIT发现磁场增强的石墨烯超导态

Anthropic 发布 Claude Sonnet 5，智能体能力显著提升

一个姿态检测项目的踩坑实录

OpenAI用流行病学方法修复18年C++漏洞

OpenAI发布GeneBench-Pro：评估AI科研判断力新基准

免费获取 AI 落地指南