前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

Google DeepMind 推出图像与视频生成新模型

产品2026年6月29日· 原作者:Google DeepMind· 6 分钟阅读0 阅读

Google DeepMind 发布 Nano Banana 2 Lite 图像模型和 Gemini Omni Flash 视频模型。前者以 4 秒生成、极低成本著称,适合高吞吐场景;后者支持高质量视频生成与对话式编辑。两款模型现已在 Google AI Studio、Gemini API 等平台向开发者开放。

Google DeepMind 近日发布了两款重磅模型——Nano Banana 2 Lite 和 Gemini Omni Flash,旨在加速创意迭代、降低开发门槛。

Alisa Fortin
anish

Video 8

Nano Banana 2 Lite:最快、最经济的 Gemini 图像模型

Nano Banana 2 Lite(gemini-3.1-flash-lite-image)专为快速构思和高并发开发场景设计,在速度和成本上做到极致。官方建议使用第一代 Nano Banana(gemini-2.5-flash-image)的开发者立即迁移,可即刻获得性能提升。

性能基准测试显示,Nano Banana 2 和 2 Lite 在与竞品的对比中,在生成/编辑质量(Elo 评分)、处理延迟、每张 1K 分辨率图像成本等方面均有显著优势。

Nano Banana 2 Lite 突出特点:

  • 低延迟:文本转图像仅需 4 秒,适合交互式原型设计和快速视觉草图。
  • 成本效益:每张 1K 图像仅 $0.034,大幅降低运营成本。

尽管追求速度,该模型仍保持可靠的提示词遵循能力、角色一致性以及清晰的文字渲染。

Nano Banana 系列概览

  • Nano Banana 2 Lite(Gemini 3.1 Flash Lite Image):速度优先,适合近实时、高吞吐量的工作流。
  • Nano Banana 2(Gemini 3.1 Flash Image):通用主力,质量与延迟均衡,性价比最高。
  • Nano Banana Pro(Gemini 3 Pro Image):针对复杂专业场景,提供最强控制和高级推理能力。
  • Nano Banana(Gemini 2.5 Flash Image):旧版模型,建议升级至 2 Lite。

更多功能和集成方法请参考开发者文档。

Nano Banana 2 Lite 也已登陆 Google 消费者端,包括 AI Mode(搜索)、Gemini 应用、NotebookLM、Google Photos、Stitch、Google Flow 和 Google Ads。

Gemini Omni Flash:高质量、低成本的视频生成与编辑

视频演示

Google I/O 上亮相的 Gemini Omni Flash(gemini-omni-flash-preview)如今正式向开发者开放。该模型原生支持文本、图像、视频等多模态输入,可进行高质量视频生成和对话式编辑,定价为每秒 $0.10,与 Veo 3.1 Fast 一致。

Omni Flash 优势:

  • 对话式视频编辑:用自然语言调整和编辑视频。
  • 多模态参考:结合图片、文本和视频,保持场景一致性与控制力。
  • 现实世界知识:利用 Gemini 的历史、生物学、叙事逻辑等知识构建有说服力的视频。
  • 文字与动作同步:通过简单提示,将文本和图形直接关联到视频动作。

完整基准测试信息请访问 Google DeepMind 官网。

当前限制:

  • 单次生成最长 10 秒视频(更长时长即将支持)。
  • Gemini API 暂不支持上传音频参考和场景扩展。
  • API schema 接受最长 3 秒的视频参考,但当前模型处理不完善。
  • 场景切换或镜头移动时角色一致性存在局限,团队正在改进。

Gemini Omni 即日起在 Google AI Studio 和 Gemini API 公开预览,更多功能及区域限制见开发者文档。

组合使用:从图像到视频的无缝衔接

两个模型可形成强大工作流:先用 Nano Banana 2 Lite 高速生成图像,再将图像作为参考传给 Gemini Omni Flash 生成动画或高质量视频。通过 Interactions API 保持会话上下文,用户可连续执行最多三次编辑。

Google 提供了三个演示应用帮助开发者快速上手:

  • Anywhere:上传自拍或照片,Nano Banana 2 Lite 可瞬间将你“传送”到世界地标,点击图像后由 Omni Flash 生成动画短片。
  • Space Lift:上传室内照片,自动生成不同风格的设计方案,点击视频按钮即可观看 Omni 渲染的动感效果。
  • Omni product studio:将 Nano Banana 2 Lite 生成的静态商品图转为影院级电商视频。

安全与透明度

两个模型均使用 SynthID 水印技术,用户可通过 Gemini 应用、Chrome 或搜索验证 AI 内容。Google 正在扩展内容验证工具,帮助识别网络上的 AI 生成与编辑内容。了解更多

立即开始

Nano Banana 2 Lite 资源:

  • 在 Google AI Studio 中实验模型。
  • 查看 Gemini API 文档。
  • 参考 提示词指南。

Gemini Omni Flash 资源:

  • 在 Google AI Studio 中实验模型。
  • 查看 Gemini API 文档。
  • 参考 提示词指南。

原文链接:Google DeepMind
本文由前途科技编辑整理

标签:Google DeepMind视频生成图像生成

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

CERN关闭大型强子对撞机进行15亿美元升级
TOP1

CERN关闭大型强子对撞机进行15亿美元升级

塔塔电子遭勒索,iPhone 18 Pro 数据泄露
TOP2

塔塔电子遭勒索,iPhone 18 Pro 数据泄露

3

预览 GPT-5.6 Sol:新一代模型

1小时前
预览 GPT-5.6 Sol:新一代模型
4

MIT发现磁场增强的石墨烯超导态

32分钟前
MIT发现磁场增强的石墨烯超导态
5

Anthropic 发布 Claude Sonnet 5,智能体能力显著提升

31分钟前
Anthropic 发布 Claude Sonnet 5,智能体能力显著提升
6

一个姿态检测项目的踩坑实录

32分钟前
7

OpenAI用流行病学方法修复18年C++漏洞

1小时前
OpenAI用流行病学方法修复18年C++漏洞
8

OpenAI发布GeneBench-Pro:评估AI科研判断力新基准

1小时前
OpenAI发布GeneBench-Pro:评估AI科研判断力新基准
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款