前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

OpenAI实时API新增语音并降价

洞察2024年11月14日· 5 分钟阅读2 阅读

2024 年 10 月 30 日 下午 4:25 图片来源:VentureBeat 使用 MidJourney […]

2024 年 10 月 30 日 下午 4:25

Credit: VentureBeat generated with MidJourney

图片来源:VentureBeat 使用 MidJourney 生成

订阅我们的每日和每周新闻通讯,获取业界领先的 AI 报道的最新更新和独家内容。了解更多

OpenAI 今天更新了其目前处于测试阶段的实时 API。此次更新为其平台添加了新的语音,用于语音到语音的应用程序,并降低了与缓存提示相关的成本。

实时 API 的测试用户现在可以使用五种新的语音来构建他们的应用程序。OpenAI 在 X 上的一篇帖子中展示了三种新的语音:Ash、Verse 和带有英国口音的 Ballad。

实时 API 的两个更新:– 现在可以使用五种新的语音构建语音到语音体验,这些语音更具表现力和可控性。 ???

– 我们通过使用提示缓存来降低价格。缓存的文本输入价格降低 50%,缓存的音频输入价格降低… pic.twitter.com/jLzZDBrR7l

该公司在其 API 文档中表示,原生语音到语音功能“跳过中间文本格式,意味着低延迟和细致的输出”,而这些语音比之前的语音更容易控制,也更具表现力。

然而,OpenAI 警告称,由于 API 仍处于测试阶段,它目前无法提供客户端身份验证。该公司还表示,处理实时音频可能会出现问题。

“网络状况对实时音频的影响很大,当网络状况不可预测时,大规模地从客户端可靠地传递音频到服务器是一个挑战,”该公司表示。

OpenAI 在 AI 驱动的语音和声音方面的历史一直存在争议。今年 3 月,该公司发布了 Voice Engine,这是一个与 ElevenLabs 竞争的语音克隆平台,但它将访问权限限制在少数研究人员。今年 5 月,在该公司演示了其 GPT-4o 和语音模式后,它暂停使用其中一种语音 Sky,因为女演员斯嘉丽·约翰逊对它与自己的声音相似表示了不满。

该公司于 9 月在美国为付费订阅者(使用 ChatGPT Plus、Enterprise、Teams 和 Edu 的用户)推出了 ChatGPT 高级语音模式。

理想情况下,语音到语音 AI 可以让企业使用语音构建更多实时响应。假设客户致电公司的客户服务平台,在这种情况下,语音到语音功能可以接收客户的语音,理解他们的问题,并使用 AI 生成的语音以更低的延迟进行回复。语音到语音还可以让用户生成配音,用户说出自己的台词,但输出的语音不是他们的。提供此功能的平台之一是 Replica,当然还有 ElevenLabs。

OpenAI 本月在其开发者日发布了实时 API。该 API 旨在加快语音助手的构建速度。

然而,使用语音到语音功能可能会很昂贵。

实时 API 推出时,定价结构为每分钟音频输入 0.06 美元,每分钟音频输出 0.24 美元,这并不便宜。然而,该公司计划通过提示缓存降低实时 API 的价格。

缓存的文本输入价格将下降 50%,缓存的音频输入价格将下降 80%。

OpenAI 在开发者日还宣布了提示缓存,并将经常请求的上下文和提示保存在模型的内存中。这将减少它需要创建以生成响应的令牌数量。降低输入价格可能会鼓励更多感兴趣的开发者连接到 API。

OpenAI 不是唯一推出提示缓存的公司。Anthropic 于 8 月为 Claude 3.5 Sonnet 推出了提示缓存。

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

黄仁勋苏姿丰同抵台湾备战Computex
TOP1

黄仁勋苏姿丰同抵台湾备战Computex

iOS 27 将原生支持 Google Cast
TOP2

iOS 27 将原生支持 Google Cast

3

苹果 iOS 27 大更新:AirPods、Siri、图像生成齐变

14小时前
苹果 iOS 27 大更新:AirPods、Siri、图像生成齐变
4

黄仁勋每月飞台湾催单台积电

14小时前
黄仁勋每月飞台湾催单台积电
5

iOS 27 泄露细节显示 Siri 将全面重写

14小时前
iOS 27 泄露细节显示 Siri 将全面重写
6

华为:新芯片架构2031年比肩1.4nm

10小时前
华为:新芯片架构2031年比肩1.4nm
7

稳定币主导AI智能体支付

14小时前
稳定币主导AI智能体支付
8

Anthropic安全模型Mythos短暂现身开发工具

14小时前
Anthropic安全模型Mythos短暂现身开发工具
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款