前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

Google Veo 3.1 重磅发布:全解析其强大功能与创新应用

NEXTECH
Last updated: 2025年10月16日 上午8:12
By NEXTECH
Share
8 Min Read
SHARE

Google Veo 3.1 发布: 全解析

Google 深度学习模型Veo 3.1 近期正式发布。与Sora类似,Veo 3.1生成的视频也自带同步音频。该模型能够生成8秒长的720p和1080p高清视频。在内容质量、物理效果、真实感以及对提示词的遵循方面,均展现出卓越性能。音频与视频内容结合紧密,生成内容充满创意。

Contents
Google Veo 3.1 发布: 全解析三大新功能:实用性突出Google Veo 3.1 的当前限制总结与展望

此外,本次升级还引入了三项创新功能:

  • 视频扩展:允许用户基于现有视频继续生成后续内容。
  • 首尾帧补间:用户提供起始帧和结束帧,模型将自动补全中间的过渡动画。
  • 图片引导:支持上传最多三张参考图片,以确保生成视频中的角色或风格保持一致性。

这些功能均可通过Gemini API直接调用,用户也可通过Google AI Studio进行体验。

Google Veo 3.1 视频生成示意图
但在此之前,用户需先设置一个付费账户。

https://console.cloud.google.com/billing/create

Google Cloud 计费账户创建页面

You Might Also Like

RAG技术深度解析:让AI更智能,掌握其工作原理、文档处理、检索策略与实战
美团开源LongCat-Audio-Codec:高效语音编解码器助力Speech LLM实时交互落地
沃尔沃RAG实战:企业级知识库放弃小分块策略,多模态AI文档检索系统构建与选型心得
告别蛮力:AI的“自我怀疑”如何解锁大模型推理新范式

三大新功能:实用性突出

视频扩展

例如,之前生成了一段8秒的滑翔伞起飞视频,现在可以直接指令模型继续生成:“让滑翔伞缓慢下降”。

Veo 3.1 视频扩展功能示例:滑翔伞起飞
模型将以上一段视频的最后1秒(24帧)为起点,继续生成后续内容。

Veo 3.1 视频扩展功能示例:滑翔伞下降
首尾帧补间

用户提供两张图片,例如第一张为:一只姜黄色猫咪驾驶红色敞篷车,驰骋在法国里维埃拉海岸。

Veo 3.1 首尾帧补间功能示例:姜黄色猫咪驾驶敞篷车起始帧
第二张为:车辆从悬崖上腾空而起。

Veo 3.1 首尾帧补间功能示例:汽车从悬崖起飞结束帧
模型将自动填充并生成两帧之间的过渡动画。

Veo 3.1 首尾帧补间功能示例:猫咪驾车飞跃悬崖的动画
图片引导

用户最多可上传三张参考图片,用于:

  • 展现角色的不同角度
  • 提供产品的多个细节
  • 作为风格的参考样本

模型将根据这些参考图,在生成的视频中保持相关元素的外观一致性。

例如,若首先上传一张深海安康鱼的图片,随后上传一套粉色公主裙的图片,并输入提示词:「制作一个搞笑卡通版的鱼,穿着服装游泳并挥舞魔杖」,

最终将生成一只身着公主裙的卡通安康鱼动画。

Veo 3.1 图片引导功能示例:穿着公主裙的卡通安康鱼动画

Google Veo 3.1 的当前限制

API独占:目前Veo 3.1仅支持通过API接口或Google AI Studio进行访问。

生成速度:最快可在11秒内完成生成,但在高峰期,生成时间可能延长至6分钟。

视频保留时限:生成的视频仅在服务器上保存两天,建议用户及时下载。

内容安全机制:所有生成视频均会经过安全过滤,违规提示词将被直接拦截,生成的视频将自动带有Google的AI内容标识SynthID水印。

音频生成问题:有时安全过滤机制可能会阻止视频生成,但此情况下不会产生费用。

总结与展望

Veo 3.1 本次集成了原生音频、视频扩展和帧控制等核心功能,并对生成速率进行了优化。值得关注的是,OpenAI接下来将如何应对并推出其新一代视频生成技术。

TAGGED:AI前沿Google Veo多模态大模型视频生成
Share This Article
Email Copy Link Print
Previous Article 通义DeepResearch Agent在HLE、BrowseComp和xbench-DeepSearch上的SOTA性能得分 通义DeepResearch深度解析:核心功能、模型训练与Agent前沿探讨
Next Article 20251016081502158.jpg Perplexity AI:解锁专业搜索,轻松管理账户
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251205174331374.jpg
家的定义与核心价值:探索现代居住空间的意义
科技
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技

相关内容

大模型与工程化

揭秘生成式AI迷思:工程师的实用指南与高效协作策略

2025年9月24日
Python战胜人类?
大模型与工程化

AI时代:人类不会取代Python,编程的本质永存

2025年10月15日
图1:深度研究系统示意图
大模型与工程化

解锁大模型潜力:构建智能深度研究系统的完整指南

2025年10月5日
LangExtract工作流程示意图
AI 前沿技术

LangExtract:大模型文本提炼工具功能与工作流程详解

2025年11月1日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up