前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

Google Veo 3.1 重磅发布:全解析其强大功能与创新应用

NEXTECH
Last updated: 2025年10月16日 上午8:12
By NEXTECH
Share
8 Min Read
SHARE

Google Veo 3.1 发布: 全解析

Google 深度学习模型Veo 3.1 近期正式发布。与Sora类似,Veo 3.1生成的视频也自带同步音频。该模型能够生成8秒长的720p和1080p高清视频。在内容质量、物理效果、真实感以及对提示词的遵循方面,均展现出卓越性能。音频与视频内容结合紧密,生成内容充满创意。

Contents
Google Veo 3.1 发布: 全解析三大新功能:实用性突出Google Veo 3.1 的当前限制总结与展望

此外,本次升级还引入了三项创新功能:

  • 视频扩展:允许用户基于现有视频继续生成后续内容。
  • 首尾帧补间:用户提供起始帧和结束帧,模型将自动补全中间的过渡动画。
  • 图片引导:支持上传最多三张参考图片,以确保生成视频中的角色或风格保持一致性。

这些功能均可通过Gemini API直接调用,用户也可通过Google AI Studio进行体验。

Google Veo 3.1 视频生成示意图
但在此之前,用户需先设置一个付费账户。

https://console.cloud.google.com/billing/create

Google Cloud 计费账户创建页面

You Might Also Like

参与GenAI黑客马拉松的实践洞察:大模型时代的项目开发与成长之路
Claude 新王牌 “Skills” 深度解析:让你的 AI 秒变行业专家,告别重复劳动
使用LangGraph构建高效智能体系统:深度解析与实战
DeepSeek-OCR:AI文字识别黑科技,让AI高效处理文字

三大新功能:实用性突出

视频扩展

例如,之前生成了一段8秒的滑翔伞起飞视频,现在可以直接指令模型继续生成:“让滑翔伞缓慢下降”。

Veo 3.1 视频扩展功能示例:滑翔伞起飞
模型将以上一段视频的最后1秒(24帧)为起点,继续生成后续内容。

Veo 3.1 视频扩展功能示例:滑翔伞下降
首尾帧补间

用户提供两张图片,例如第一张为:一只姜黄色猫咪驾驶红色敞篷车,驰骋在法国里维埃拉海岸。

Veo 3.1 首尾帧补间功能示例:姜黄色猫咪驾驶敞篷车起始帧
第二张为:车辆从悬崖上腾空而起。

Veo 3.1 首尾帧补间功能示例:汽车从悬崖起飞结束帧
模型将自动填充并生成两帧之间的过渡动画。

Veo 3.1 首尾帧补间功能示例:猫咪驾车飞跃悬崖的动画
图片引导

用户最多可上传三张参考图片,用于:

  • 展现角色的不同角度
  • 提供产品的多个细节
  • 作为风格的参考样本

模型将根据这些参考图,在生成的视频中保持相关元素的外观一致性。

例如,若首先上传一张深海安康鱼的图片,随后上传一套粉色公主裙的图片,并输入提示词:「制作一个搞笑卡通版的鱼,穿着服装游泳并挥舞魔杖」,

最终将生成一只身着公主裙的卡通安康鱼动画。

Veo 3.1 图片引导功能示例:穿着公主裙的卡通安康鱼动画

Google Veo 3.1 的当前限制

API独占:目前Veo 3.1仅支持通过API接口或Google AI Studio进行访问。

生成速度:最快可在11秒内完成生成,但在高峰期,生成时间可能延长至6分钟。

视频保留时限:生成的视频仅在服务器上保存两天,建议用户及时下载。

内容安全机制:所有生成视频均会经过安全过滤,违规提示词将被直接拦截,生成的视频将自动带有Google的AI内容标识SynthID水印。

音频生成问题:有时安全过滤机制可能会阻止视频生成,但此情况下不会产生费用。

总结与展望

Veo 3.1 本次集成了原生音频、视频扩展和帧控制等核心功能,并对生成速率进行了优化。值得关注的是,OpenAI接下来将如何应对并推出其新一代视频生成技术。

TAGGED:AI前沿Google Veo多模态大模型视频生成
Share This Article
Email Copy Link Print
Previous Article 通义DeepResearch Agent在HLE、BrowseComp和xbench-DeepSearch上的SOTA性能得分 通义DeepResearch深度解析:核心功能、模型训练与Agent前沿探讨
Next Article 20251016081502158.jpg Perplexity AI:解锁专业搜索,轻松管理账户
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251111101254652.jpg
欧盟拟强制禁用华为中兴:欧洲5G网络面临巨变?
科技
在Google TV上运行的Gemini for TV
AI 赋能新篇章:Gemini for TV 今日起全面登陆 Google TV Streamer 设备
科技
贝莱德2025年第四季度全球投资展望概览
贝莱德深度解读:2025年第四季度全球投资展望与核心策略洞察
报告
Polaris Alpha模型界面截图,展示其API调用能力
GPT-5.1“马甲”Polaris Alpha免费泄露:年末AI更新潮将至,性能抢先看
AI 前沿技术

相关内容

静态质检与动态攻防演习的区别
AI 前沿技术

AI安全的“皇帝新衣”:千亿级模型投资正建立在集体幻觉之上

2025年10月26日
图1:面向AI代理的7款免费Web搜索API
大模型与工程化

面向AI代理的7款免费Web搜索API:获取实时信息,提升智能表现

2025年9月21日
Python战胜人类?
大模型与工程化

AI时代:人类不会取代Python,编程的本质永存

2025年10月15日
Anthropic研究引发关注
AI 前沿技术

Anthropic重磅研究:250份文档即可投毒任意大模型,颠覆AI安全认知

2025年10月12日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up