前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

OpenAI实时API新增语音并降价

NEXTECH
Last updated: 2024年11月14日 下午8:57
By NEXTECH
Share
11 Min Read
SHARE

2024 年 10 月 30 日 下午 4:25

Credit: VentureBeat generated with MidJourney

图片来源:VentureBeat 使用 MidJourney 生成

订阅我们的每日和每周新闻通讯,获取业界领先的 AI 报道的最新更新和独家内容。了解更多

OpenAI 今天更新了其目前处于测试阶段的实时 API。此次更新为其平台添加了新的语音,用于语音到语音的应用程序,并降低了与缓存提示相关的成本。

实时 API 的测试用户现在可以使用五种新的语音来构建他们的应用程序。OpenAI 在 X 上的一篇帖子中展示了三种新的语音:Ash、Verse 和带有英国口音的 Ballad。

实时 API 的两个更新:– 现在可以使用五种新的语音构建语音到语音体验,这些语音更具表现力和可控性。 ???

– 我们通过使用提示缓存来降低价格。缓存的文本输入价格降低 50%,缓存的音频输入价格降低… pic.twitter.com/jLzZDBrR7l

该公司在其 API 文档中表示,原生语音到语音功能“跳过中间文本格式,意味着低延迟和细致的输出”,而这些语音比之前的语音更容易控制,也更具表现力。

然而,OpenAI 警告称,由于 API 仍处于测试阶段,它目前无法提供客户端身份验证。该公司还表示,处理实时音频可能会出现问题。

“网络状况对实时音频的影响很大,当网络状况不可预测时,大规模地从客户端可靠地传递音频到服务器是一个挑战,”该公司表示。

OpenAI 在 AI 驱动的语音和声音方面的历史一直存在争议。今年 3 月,该公司发布了 Voice Engine,这是一个与 ElevenLabs 竞争的语音克隆平台,但它将访问权限限制在少数研究人员。今年 5 月,在该公司演示了其 GPT-4o 和语音模式后,它暂停使用其中一种语音 Sky,因为女演员斯嘉丽·约翰逊对它与自己的声音相似表示了不满。

该公司于 9 月在美国为付费订阅者(使用 ChatGPT Plus、Enterprise、Teams 和 Edu 的用户)推出了 ChatGPT 高级语音模式。

理想情况下,语音到语音 AI 可以让企业使用语音构建更多实时响应。假设客户致电公司的客户服务平台,在这种情况下,语音到语音功能可以接收客户的语音,理解他们的问题,并使用 AI 生成的语音以更低的延迟进行回复。语音到语音还可以让用户生成配音,用户说出自己的台词,但输出的语音不是他们的。提供此功能的平台之一是 Replica,当然还有 ElevenLabs。

OpenAI 本月在其开发者日发布了实时 API。该 API 旨在加快语音助手的构建速度。

然而,使用语音到语音功能可能会很昂贵。

实时 API 推出时,定价结构为每分钟音频输入 0.06 美元,每分钟音频输出 0.24 美元,这并不便宜。然而,该公司计划通过提示缓存降低实时 API 的价格。

缓存的文本输入价格将下降 50%,缓存的音频输入价格将下降 80%。

OpenAI 在开发者日还宣布了提示缓存,并将经常请求的上下文和提示保存在模型的内存中。这将减少它需要创建以生成响应的令牌数量。降低输入价格可能会鼓励更多感兴趣的开发者连接到 API。

OpenAI 不是唯一推出提示缓存的公司。Anthropic 于 8 月为 Claude 3.5 Sonnet 推出了提示缓存。

Share This Article
Email Copy Link Print
Previous Article Patronus AI 推出全球首个防AI幻觉自服务API
Next Article ChatGPT 新增网络搜索功能
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251205190349369.jpg
Meta战略大转向:削减30%元宇宙预算,全力押注AI
科技
20251205183721458.jpg
南部非洲古人类基因组改写进化史:20万年隔离与独特基因
科技
20251205180959635.jpg
AMD为对华出口AI芯片支付15%税费,引发美国宪法争议
科技
20251205174331374.jpg
家的定义与核心价值:探索现代居住空间的意义
科技

相关内容

AI

FTC 严查 AI 公司,DoNotPay 为例

2024年9月26日
20250318225215645.jpg
AI

AI赋能工业元宇宙中的机器人训练

2025年3月19日
Jessica Boothe and Brian Comiskey of the CTA at the start of CES 2024.
AI

CES 2025 科技盛会预告

2025年2月5日
Embedding空间示意图
AI 前沿技术

什么是 Embedding?万物皆可Embedding:定义、作用与核心应用场景解析

2025年10月4日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up