前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

OpenAI 模型加速媒体生成 50 倍

洞察2024年11月14日· 5 分钟阅读7 阅读

订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多 OpenAI 的两位 […]

订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多

OpenAI 的两位研究人员发表了一篇论文,描述了一种新型模型——具体来说,是一种新型的连续时间一致性模型 (sCM)——它将包括图像、视频和音频在内的多媒体的生成速度提高了 50 倍,与传统的扩散模型相比,在不到十分之一秒的时间内生成图像,而常规扩散模型则需要超过 5 秒。

通过引入 sCM,OpenAI 仅用两个采样步骤就实现了可比的样本质量,提供了一种在不影响质量的情况下加速生成过程的解决方案。

Cheng Lu 和 Yang Song 在 arXiv.org 上发表的预同行评审论文和今天发布的博客文章中描述了这一创新,它使这些模型能够在短短两个步骤内生成高质量样本——比以前需要数百个步骤的基于扩散的模型快得多。

Song 也是 2023 年 OpenAI 研究人员(包括前首席科学家 Ilya Sutskever)发表的一篇论文的主要作者,该论文提出了“一致性模型”的概念,即“同一轨迹上的点映射到相同的初始点”。

虽然扩散模型在生成逼真的图像、3D 模型、音频和视频方面取得了出色的成果,但它们在采样方面的低效率——通常需要数十到数百个顺序步骤——使其不太适合实时应用。

从理论上讲,这项技术可以为 OpenAI 提供一个近乎实时的 AI 图像生成模型的基础。正如 VentureBeat 的另一位记者 Sean Michael Kerner 在我们内部 Slack 频道中所言,“DALL-E 4 还会远吗?”

在传统的扩散模型中,需要大量的去噪步骤来创建样本,这导致了它们的速度缓慢。

相比之下,sCM 在一到两个步骤内直接将噪声转换为高质量样本,从而降低了计算成本和时间。

OpenAI 最大的 sCM 模型拥有 15 亿个参数,可以在单个 A100 GPU 上仅用 0.11 秒生成一个样本。

与扩散模型相比,这使得时钟时间加快了 50 倍,使实时生成式 AI 应用变得更加可行。

sCM 背后的团队在 ImageNet 512×512 上训练了一个连续时间一致性模型,扩展到 15 亿个参数。

即使在如此规模下,该模型仍然保持着与最佳扩散模型相媲美的样本质量,在 ImageNet 512×512 上实现了 1.88 的 Fréchet Inception Distance (FID) 分数。

这使得样本质量达到了扩散模型的 90%,而扩散模型需要大量的计算量才能获得类似的结果。

OpenAI 的新方法已经针对其他最先进的生成模型进行了广泛的基准测试。

通过使用 FID 分数衡量样本质量,并衡量有效采样计算,研究表明 sCM 在计算开销明显更低的情况下提供了顶级结果。

虽然以前快速采样方法在样本质量降低或训练设置复杂方面存在困难,但 sCM 成功地克服了这些挑战,既提供了速度又提供了高保真度。

sCM 的成功也归功于它能够与它从中提取知识的教师扩散模型成比例地扩展。

随着 sCM 和教师扩散模型的规模不断扩大,样本质量之间的差距进一步缩小,并且增加 sCM 中的采样步骤数量会进一步减少质量差异。

sCM 模型的快速采样和可扩展性为跨多个领域的实时生成式 AI 开辟了新的可能性。

从图像生成到音频和视频合成,sCM 为需要快速、高质量输出的应用提供了一种实用的解决方案。

此外,OpenAI 的研究暗示了进一步优化系统的潜力,这可以进一步提高性能,使这些模型能够适应各个行业的特定需求。

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

中国指责美国破坏全球芯片供应链
TOP1

中国指责美国破坏全球芯片供应链

Anthropic呼吁全球暂停前沿AI开发
TOP2

Anthropic呼吁全球暂停前沿AI开发

3

前IBM高管指控IBM与AT&T隐瞒黑客入侵

10小时前
前IBM高管指控IBM与AT&T隐瞒黑客入侵
4

沃伦邀请黄仁勋出席对华芯片听证会

10小时前
沃伦邀请黄仁勋出席对华芯片听证会
5

美日启动10亿美元AI研究合作

10小时前
美日启动10亿美元AI研究合作
6

CISA将发布指令执行特朗普AI行政令

10小时前
CISA将发布指令执行特朗普AI行政令
7

Meta 智能眼镜应用暗藏面部识别代码

10小时前
Meta 智能眼镜应用暗藏面部识别代码
8

Airbnb CEO 计划成立新 AI 实验室

10小时前
Airbnb CEO 计划成立新 AI 实验室
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款