前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

亚马逊Nova Sonic实时语音模型赋能企业

NEXTECH
Last updated: 2025年8月21日 上午6:52
By NEXTECH
Share
11 Min Read
SHARE

“`html

亚马逊Nova Sonic:革新实时语音交互的AI引擎

亚马逊,这家电商巨头,其Alexa语音助手近期凭借亚马逊Nova和对Anthropic的投资获得了显著的智能提升。而今,Alexa即将迎来一位强大的“兄弟”——Amazon Nova Sonic。

Nova Sonic是一款全新的基础模型,旨在帮助第三方应用开发者,通过亚马逊Bedrock平台,轻松构建逼真自然的实时语音交互体验。它现已通过双向流式API提供。

事实上,部分Nova Sonic技术——包括语音编码器和语音合成器——已被整合到最新的Alexa+模型中。亚马逊发言人表示,这种策略能够同时为不同应用场景带来语音技术的优势,并根据用户反馈和技术进步持续改进系统。

Nova Sonic的应用场景广泛,涵盖客户支持、引导、信息检索和娱乐等领域。它巧妙地解决了语音AI领域长期存在的技术碎片化难题。

亚马逊人工智能高级副总裁兼首席科学家Rohit Prasad在接受VentureBeat采访时指出,传统上,构建语音接口需要整合语音识别、语言处理和语音合成等多个独立模型,这导致交互生硬、开发成本高昂。

Nova Sonic的创新之处在于将这三种模型融合为一体,不仅理解“内容”,更能把握“表达方式”。它保留了音调、节奏和风格等声学语境,使对话更贴近自然的人际交流。

Nova Sonic支持实时双向对话,能够识别用户停顿、犹豫或打断等行为,并流畅地回应,同时保持上下文连贯性。这在客户服务等场景中尤为重要。

此外,Nova Sonic还能与其他系统无缝集成,自动生成语音输入的文本记录,触发API或与专有工具交互。企业可以利用它构建AI代理,完成预约、检索实时信息或解答复杂客户咨询等任务。

Nova Sonic在基准测试中表现出色,在Common Eval数据集上,其在美式英语单轮对话中,以男性语音击败Gemini Flash 2.0的胜率为69.7%,击败GPT-4o的胜率为51.0%。女性和英式英语语音也取得了类似的成绩。

Prasad强调,Nova Sonic在主要语言市场表现最佳,在对话自然度和准确性方面均超越了实时GPT-4o。在语音识别方面,Nova Sonic在多语言和真实环境下的表现同样优异。

目前,Nova Sonic支持多种富有表现力的语音,包括美式和英式英语的男声和女声。亚马逊表示,更多口音和语言支持正在开发中。

Nova Sonic还具有速度快、成本低的优势。第三方基准测试显示,其客户感知延迟为1.09秒,低于GPT-4o的1.18秒和Gemini Flash 2.0的1.41秒。价格方面,Nova Sonic比实时GPT-4o便宜近80%。

多家公司已开始使用或测试Nova Sonic,例如ASAPP、Education First (EF)和Stats Perform,分别将其应用于优化呼叫中心工作流程、支持语言学习者和增强AI聊天平台。

亚马逊注重负责任的AI开发,Nova系列模型内置安全机制,并提供AWS AI服务卡,明确使用案例、潜在限制和伦理准则。亚马逊致力于确保语音生成的可靠性和安全性,防止语音克隆或不必要的模仿。

Amazon Nova Sonic现已通过Amazon Bedrock正式发布。开发者和企业可访问https://aws.amazon.com/nova/了解更多信息。

“`

Share This Article
Email Copy Link Print
Previous Article 全球智能眼镜TOP5出炉:华为第2、小米第4 Counterpoint:2025年上半年全球智能眼镜出货量同比增长110%
Next Article 2025产品50强获奖名单揭晓!
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251228110101819.jpg
中国拟规管AI伴侣:防沉迷新规与全球监管趋势
科技
20251228103248390.jpg
阿里通义千问将主导2026年AI格局?Wired深度解析
科技
20251228100451990.jpg
OpenAI高薪55.5万美元急聘安全主管,AI安全危机何解?
科技
20251228093716882.jpg
谷歌AI眼镜2026回归,布林反思初代失败教训
科技

相关内容

illustration-of-two-laptops-facing-each-
AI

Meta 开放人工智能模型用于美军

2024年11月18日
breadcrumbs.jpg?resize=1200,600
AI

AI 编码的第二次浪潮来临

2025年4月3日
Image 58
AI应用场景

AI认知行为教练:一组解决工作拖延的提示词与行动计划

2025年10月12日
MineContext自动收集屏幕上下文功能演示
AI 前沿技术

字节跳动开源MineContext:智能上下文管理框架,助力AGI普惠

2025年10月23日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up