前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

Google Veo 3.1 重磅发布:全解析其强大功能与创新应用

NEXTECH
Last updated: 2025年10月16日 上午8:12
By NEXTECH
Share
8 Min Read
SHARE

Google Veo 3.1 发布: 全解析

Google 深度学习模型Veo 3.1 近期正式发布。与Sora类似,Veo 3.1生成的视频也自带同步音频。该模型能够生成8秒长的720p和1080p高清视频。在内容质量、物理效果、真实感以及对提示词的遵循方面,均展现出卓越性能。音频与视频内容结合紧密,生成内容充满创意。

Contents
Google Veo 3.1 发布: 全解析三大新功能:实用性突出Google Veo 3.1 的当前限制总结与展望

此外,本次升级还引入了三项创新功能:

  • 视频扩展:允许用户基于现有视频继续生成后续内容。
  • 首尾帧补间:用户提供起始帧和结束帧,模型将自动补全中间的过渡动画。
  • 图片引导:支持上传最多三张参考图片,以确保生成视频中的角色或风格保持一致性。

这些功能均可通过Gemini API直接调用,用户也可通过Google AI Studio进行体验。

Google Veo 3.1 视频生成示意图
但在此之前,用户需先设置一个付费账户。

https://console.cloud.google.com/billing/create

Google Cloud 计费账户创建页面

You Might Also Like

OpenAI Atlas深度体验:AI浏览器革新之路才刚开始
OpenAI 再度开源安全分类模型 gpt-oss-safeguard:准确率超越 GPT-5,详解其优势与应用
Agentic AI与AI Agent:核心区别、特征及应用策略
RAG解决方案评估:从构建到生产就绪的全面指南

三大新功能:实用性突出

视频扩展

例如,之前生成了一段8秒的滑翔伞起飞视频,现在可以直接指令模型继续生成:“让滑翔伞缓慢下降”。

Veo 3.1 视频扩展功能示例:滑翔伞起飞
模型将以上一段视频的最后1秒(24帧)为起点,继续生成后续内容。

Veo 3.1 视频扩展功能示例:滑翔伞下降
首尾帧补间

用户提供两张图片,例如第一张为:一只姜黄色猫咪驾驶红色敞篷车,驰骋在法国里维埃拉海岸。

Veo 3.1 首尾帧补间功能示例:姜黄色猫咪驾驶敞篷车起始帧
第二张为:车辆从悬崖上腾空而起。

Veo 3.1 首尾帧补间功能示例:汽车从悬崖起飞结束帧
模型将自动填充并生成两帧之间的过渡动画。

Veo 3.1 首尾帧补间功能示例:猫咪驾车飞跃悬崖的动画
图片引导

用户最多可上传三张参考图片,用于:

  • 展现角色的不同角度
  • 提供产品的多个细节
  • 作为风格的参考样本

模型将根据这些参考图,在生成的视频中保持相关元素的外观一致性。

例如,若首先上传一张深海安康鱼的图片,随后上传一套粉色公主裙的图片,并输入提示词:「制作一个搞笑卡通版的鱼,穿着服装游泳并挥舞魔杖」,

最终将生成一只身着公主裙的卡通安康鱼动画。

Veo 3.1 图片引导功能示例:穿着公主裙的卡通安康鱼动画

Google Veo 3.1 的当前限制

API独占:目前Veo 3.1仅支持通过API接口或Google AI Studio进行访问。

生成速度:最快可在11秒内完成生成,但在高峰期,生成时间可能延长至6分钟。

视频保留时限:生成的视频仅在服务器上保存两天,建议用户及时下载。

内容安全机制:所有生成视频均会经过安全过滤,违规提示词将被直接拦截,生成的视频将自动带有Google的AI内容标识SynthID水印。

音频生成问题:有时安全过滤机制可能会阻止视频生成,但此情况下不会产生费用。

总结与展望

Veo 3.1 本次集成了原生音频、视频扩展和帧控制等核心功能,并对生成速率进行了优化。值得关注的是,OpenAI接下来将如何应对并推出其新一代视频生成技术。

TAGGED:AI前沿Google Veo多模态大模型视频生成
Share This Article
Email Copy Link Print
Previous Article 通义DeepResearch Agent在HLE、BrowseComp和xbench-DeepSearch上的SOTA性能得分 通义DeepResearch深度解析:核心功能、模型训练与Agent前沿探讨
Next Article 20251016081502158.jpg Perplexity AI:解锁专业搜索,轻松管理账户
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251205180959635.jpg
AMD为对华出口AI芯片支付15%税费,引发美国宪法争议
科技
20251205174331374.jpg
家的定义与核心价值:探索现代居住空间的意义
科技
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技

相关内容

PaddleOCR-VL化学方程式识别结果
AI 前沿技术

DeepSeek与百度OCR技术深度对比:谁是文档识别新水准的引领者?

2025年10月23日
OpenAI DevDay 2025产品发布
AI 前沿技术

OpenAI DevDay 2025:重塑AI开发生态的技术盛宴,多项重磅产品及工具发布

2025年10月9日
大模型与工程化

构建稳健数据与AI系统的完整指南:从理论到实践

2025年11月23日
OpenAI奥特曼与Rowan Cheung访谈
AI 前沿技术

OpenAI奥特曼:ChatGPT无法取代“真正工作”——深度访谈GPT-6、AGI与AI未来

2025年10月15日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up