前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

人工智能与机器人应该有机器声音

NEXTECH
Last updated: 2025年1月31日 上午6:56
By NEXTECH
Share
13 Min Read
SHARE

collage-showing-a-cragstan-talking-robot

我们已经习惯了人工智能的声音,从Siri、Alexa到Gemini,它们无处不在,甚至渗透到客服电话的迷宫般的语音系统中。如今,AI生成的语音技术已经可以模仿人类语音的每一个细微差别,甚至包括特定的地区口音。只需几秒钟的音频,AI就能克隆一个人的声音。

这项技术将取代许多领域的人类。自动化的客服将通过减少呼叫中心的员工来节省成本。AI代理将代表我们进行通话,用自然语言与他人交谈。所有这些正在发生,并且很快就会成为常态。

然而,与机器人对话和与人对话之间存在着本质上的区别。人可以成为朋友,而AI则不能,无论人们如何对待它或对其做出反应。AI充其量只是一个工具,最坏的情况是操纵的工具。人类需要知道我们是在与一个有血有肉的人交谈,还是与一个受控于操控者的人工智能机器人交谈。这就是为什么机器人应该听起来像机器人。

我们不能仅仅给AI生成的语音贴上标签,因为它将以多种形式出现。因此,我们需要一种识别AI的方法,无论其形式如何都能奏效。它需要适用于长短不一的音频片段,甚至只是一秒钟的音频。它需要适用于任何语言,以及任何文化背景。同时,我们不应该限制底层系统的复杂性或语言复杂性。

我们有一个简单的建议:所有会说话的AI和机器人应该使用环形调制器。在20世纪中期,在合成出真正具有机器人声音的语音之前,环形调制器被用来使演员的声音听起来像机器人。在过去的几十年里,我们已经习惯了机器人的声音,仅仅是因为文本转语音系统已经足够好,可以产生可理解的语音,而这种语音在声音上并不像人类。现在,我们可以使用同样的技术,使听起来与人类声音无法区分的机器人语音再次具有机器人特征。

You Might Also Like

企业级SLM加速:可微自适应融合
OpenAI技术总监离职
扎克伯格与特朗普共进晚餐:科技与政治的未来
AI 赚钱秘诀:如何用它创造收入

环形调制器有几个优点:它在计算上很简单,可以在实时应用,不会影响语音的可理解性,最重要的是,由于它在描绘机器人方面的历史用途,它具有普遍的“机器人声音”。

负责任的AI公司,无论以何种形式提供语音合成或AI语音助手,都应该添加一个标准频率(例如,30-80 Hz)和最小振幅(例如,20%)的环形调制器。就这样。人们会很快明白过来。

以下是一些示例,您可以收听以了解我们的建议。第一个片段是Google的NotebookLM生成的这篇文章的AI生成的“播客”,其中有两个AI“主持人”。Google的NotebookLM仅根据这篇文章的文本创建了播客脚本和音频。接下来的两个片段是同一个播客,但AI的声音被环形调制器以更微妙和更明显的方式调制:

由Google的NotebookLM生成的原始音频样本


您的浏览器不支持音频元素。

添加了环形调制器(30 Hz-25%)的音频样本


您的浏览器不支持音频元素。

添加了环形调制器(30 Hz-40%)的音频样本


您的浏览器不支持音频元素。

我们能够使用Anthropic的Claude生成的50行Python脚本生成音频效果。最著名的机器人声音之一是1960年代《神秘博士》中的达莱克的声音。当时,机器人声音很难合成,所以音频实际上是演员的声音通过环形调制器处理过的。它被设置为大约30 Hz,就像我们在示例中所做的那样,不同的调制深度(振幅)取决于机器人效果的强度。我们预计,AI行业将测试并收敛于这些参数和设置的良好平衡,并将使用比50行Python脚本更好的工具,但这突出了实现这一目标的简单性。

当然,AI声音也会被用于恶意目的。利用语音克隆进行的诈骗每年都在变得更容易,但只要有足够的专业知识,多年来一直都是可能的。就像我们正在了解我们不能再相信我们看到的图像和视频一样,因为它们很容易是AI生成的,我们很快就会了解到,一个听起来像家人的人紧急要求钱,可能只是一个使用语音克隆工具的骗子。

我们不希望骗子遵循我们的建议:无论如何,他们都会找到方法。但这对于安全标准来说一直都是如此,涨潮会抬升所有船只。我们认为,大多数用途将与来自主要公司的流行语音API相关联——每个人都应该知道他们是在与机器人交谈。

Share This Article
Email Copy Link Print
Previous Article AI赋能数据价值:2024年新突破
Next Article 20250130230214370.jpg 斯坦福大学推出AI工具STORM,轻松生成维基百科式报告
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
佐思汽研:2024年中国自主品牌主机厂研发费用排名
报告
小米汽车5月交付量超过28000台:正在为YU7大规模量产做准备
小米汽车:2025年5月交付量超28000台
报告
新势力价格屠夫卖爆!零跑5月交付45067辆 破历史新高
零跑汽车:2025年5月交付45067台,同比增长148%
报告
洛图科技:2025年4月全球大尺寸液晶电视面板出货量1870万片,同比下降11.3%
报告

相关内容

AI

Gartner预测:AI代理将改变工作方式,但失望情绪正在上升

2024年11月14日
AI

DevRev获1.08亿美元A轮融资,估值11.5亿美元成为AI独角兽

2024年11月14日
20250313055015935.jpg
AI

教育变革:企业领导者如何借鉴AI发展

2025年3月13日
AI

英伟达发布插件提升虚幻引擎5数字人逼真度

2024年10月2日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?