前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

Google Veo 3.1 重磅发布:全解析其强大功能与创新应用

NEXTECH
Last updated: 2025年10月16日 上午8:12
By NEXTECH
Share
8 Min Read
SHARE

Google Veo 3.1 发布: 全解析

Google 深度学习模型Veo 3.1 近期正式发布。与Sora类似,Veo 3.1生成的视频也自带同步音频。该模型能够生成8秒长的720p和1080p高清视频。在内容质量、物理效果、真实感以及对提示词的遵循方面,均展现出卓越性能。音频与视频内容结合紧密,生成内容充满创意。

Contents
Google Veo 3.1 发布: 全解析三大新功能:实用性突出Google Veo 3.1 的当前限制总结与展望

此外,本次升级还引入了三项创新功能:

  • 视频扩展:允许用户基于现有视频继续生成后续内容。
  • 首尾帧补间:用户提供起始帧和结束帧,模型将自动补全中间的过渡动画。
  • 图片引导:支持上传最多三张参考图片,以确保生成视频中的角色或风格保持一致性。

这些功能均可通过Gemini API直接调用,用户也可通过Google AI Studio进行体验。

Google Veo 3.1 视频生成示意图
但在此之前,用户需先设置一个付费账户。

https://console.cloud.google.com/billing/create

Google Cloud 计费账户创建页面

You Might Also Like

什么是 Embedding?万物皆可Embedding:定义、作用与核心应用场景解析
火山引擎AICC机密计算重磅升级:开源Trusted MCP,实现全链路安全
2025年末数据与AI十大趋势展望:洞悉生产级AI的未来挑战与机遇
OpenAI 2025开发者日重磅发布:ChatGPT变身操作系统,AgentKit赋能8分钟拖拽构建复杂AI Agent

三大新功能:实用性突出

视频扩展

例如,之前生成了一段8秒的滑翔伞起飞视频,现在可以直接指令模型继续生成:“让滑翔伞缓慢下降”。

Veo 3.1 视频扩展功能示例:滑翔伞起飞
模型将以上一段视频的最后1秒(24帧)为起点,继续生成后续内容。

Veo 3.1 视频扩展功能示例:滑翔伞下降
首尾帧补间

用户提供两张图片,例如第一张为:一只姜黄色猫咪驾驶红色敞篷车,驰骋在法国里维埃拉海岸。

Veo 3.1 首尾帧补间功能示例:姜黄色猫咪驾驶敞篷车起始帧
第二张为:车辆从悬崖上腾空而起。

Veo 3.1 首尾帧补间功能示例:汽车从悬崖起飞结束帧
模型将自动填充并生成两帧之间的过渡动画。

Veo 3.1 首尾帧补间功能示例:猫咪驾车飞跃悬崖的动画
图片引导

用户最多可上传三张参考图片,用于:

  • 展现角色的不同角度
  • 提供产品的多个细节
  • 作为风格的参考样本

模型将根据这些参考图,在生成的视频中保持相关元素的外观一致性。

例如,若首先上传一张深海安康鱼的图片,随后上传一套粉色公主裙的图片,并输入提示词:「制作一个搞笑卡通版的鱼,穿着服装游泳并挥舞魔杖」,

最终将生成一只身着公主裙的卡通安康鱼动画。

Veo 3.1 图片引导功能示例:穿着公主裙的卡通安康鱼动画

Google Veo 3.1 的当前限制

API独占:目前Veo 3.1仅支持通过API接口或Google AI Studio进行访问。

生成速度:最快可在11秒内完成生成,但在高峰期,生成时间可能延长至6分钟。

视频保留时限:生成的视频仅在服务器上保存两天,建议用户及时下载。

内容安全机制:所有生成视频均会经过安全过滤,违规提示词将被直接拦截,生成的视频将自动带有Google的AI内容标识SynthID水印。

音频生成问题:有时安全过滤机制可能会阻止视频生成,但此情况下不会产生费用。

总结与展望

Veo 3.1 本次集成了原生音频、视频扩展和帧控制等核心功能,并对生成速率进行了优化。值得关注的是,OpenAI接下来将如何应对并推出其新一代视频生成技术。

TAGGED:AI前沿Google Veo多模态大模型视频生成
Share This Article
Email Copy Link Print
Previous Article 通义DeepResearch Agent在HLE、BrowseComp和xbench-DeepSearch上的SOTA性能得分 通义DeepResearch深度解析:核心功能、模型训练与Agent前沿探讨
Next Article 20251016081502158.jpg Perplexity AI:解锁专业搜索,轻松管理账户
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251228110101819.jpg
中国拟规管AI伴侣:防沉迷新规与全球监管趋势
科技
20251228103248390.jpg
阿里通义千问将主导2026年AI格局?Wired深度解析
科技
20251228100451990.jpg
OpenAI高薪55.5万美元急聘安全主管,AI安全危机何解?
科技
20251228093716882.jpg
谷歌AI眼镜2026回归,布林反思初代失败教训
科技

相关内容

大模型与工程化

2025年度必读:AI智能体、Python、大语言模型与前沿趋势盘点

2025年12月21日
图片1:vLLM服务大模型推理入门指南
大模型与工程化

vLLM:为大语言模型推理提速的利器——极简入门指南

2025年9月21日
业务场景测试报告示例2
AI 前沿技术

天猫行业中后台前端研发Agent设计:AI提效与范式变革实践

2025年10月21日
不同大小正方形绘制图表2
大模型与工程化

几何谜题揭示:一年间大模型能力飞跃的惊人演进

2025年10月8日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up