美国语音识别公司SoundHound:推出人工智能语音助手

截至目前,苹果公司的Siri、亚马逊的Alexa和SoundHound,特别是从自然语言处理(NLP)和自然语言理解(NLU)方面来讲,它们代表了智能语音对话技术数十年的发展。然而,此项技术仍然十分粗糙,算法难以替代人脑。事实上,称其为“助手”可能有点宽容。这些交互式语音系统连简单的查询都难以执行,有时还会闹出笑话。但如果它们明确了一项指令或任务,智能语音助手会比打字、通话或其他形式执行更迅速。这是一项专为懒人设计的技术,毋庸置疑,未来包括厨房洗碗池在内的一切都将用到语音交互技术,甚至无处不在。

总部位于硅谷的SoundHound公司欲向投资者推销人工智能语音助手。此外,该公司拟与一家特殊目的收购公司(SPAC)合并。

关于SoundHound

三年前,SoundHound作为当时资金最雄厚的智能语音助手公司之一。拥有16年历史的SoundHound位于美国加利福尼亚州的圣克拉拉县。它表示,目前已筹集了约2.8亿美元,投资者名单包括现代、戴姆勒、梅赛德斯-奔驰、电子巨头三星、中国科技巨头腾讯、人工智能芯片制造商NVIDIA,以及欧洲运营商Orange、韩国电信公司、硅谷风险投资公司Kleiner Perkins等。

尽管如此,SoundHound还是选择与特殊目的收购公司Archimedes Tech SPAC Partners Co.签订最终合并协议,进入公共市场。加入该方的其他私人投资者包括Oracle、卡塔尔第一银行(Qatar First Bank)和美国科氏工业集团(Koch Industries),并通过追加1.11亿美元的交易和反向合并,从中净赚2.44亿美元。此次交易的估值约21亿美元。而另一家名为REE Automotive的以色列电动汽车技术初创公司,在一些投资者退出后,它的净收益下降了2亿多美元。

此外,散户投资者似乎注意到,上个月传出即将合并的消息时,SPAC当前股价几乎没有发生变动,略低于给这些特殊目的收购公司的10美元违约股价。

核心技术

NLP技术并非是AI技术中最吸引人的一点,但如果想让机器能切实有效地理解和回应我们,这一点至关重要。SoundHound声称,它已经开发出一种可处理复杂问题的语音人工智能助手。SoundHound于2015年由一群斯坦福大学的毕业生创办,最初开发了一款类似Shazam的应用程序,可以进行音乐识别。但它的命运与Shazam不同,它没有被微软以4亿美元的价格收购。十年后,SoundHound推出了一个人工智能驱动的交互式语音平台,包括两项核心技术——“语音到意义”和“深层意义解读”。

NLP technology from SoundHound
SoundHound NLP技术的组件之一 来源:SoundHound

前者是旗舰产品,指的是该平台能实时将语音转换为意义。大部分传统方法首先将语音转换为文本,再将文本转换为意义。SoundHound表示,它的技术反应更快、更准确,因为它可以同时进行语音识别和语言理解。后者帮助语音助手同时解决多个复杂问题以及筛选结果。

例如,人工智能语音助手可以处理此类问题:“显示太空针塔半英里内的全部餐厅,可在周三晚上9点后开放,要有室外座位。”当然还有后续要求,例如,“除了三星以下的餐厅或快餐店。”再试试看Siri。Android和Apple设备上都有Hound这款免费语音搜索和助手应用。测试结果显示,Hound处理速度很快,但也遇到了一些问题,这些问题同样困住了Siri和她的“兄弟们”。

A sampling of SoundHound content domains.
SoundHound 主菜单采样 来源:SoundHound

SoundHound的企业客户端,有一个语音AI开发平台Houndify,客户可以访问仪表盘及其他工具。Houndify通过分析客户使用情况,优化语音体验。此外,Houndify支持客户与数百个域实现交互,且域内程序可为客户提供和询问相关信息,比如天气、航班状态、体育等其他功能。公司利用集体人工智能(Collective AI)架构连接各种知识领域,确保平台智能化。该技术在断网的情况下也能运作,支持20多种语言,故Houndify的市场不仅限于美国。

目标市场

SoundHound声称,预估到2026年,相关应用市场规模将达到1600亿美元。解决方案涉及多个行业,如下图所示:

SoundHound total address market for AI voice.
来源:SoundHound

采用SoundHound交互语音技术的公司包括现代、奔驰、潘多拉、万事达卡、德国电信和Snap等。例如,万事达卡的交易与白色城堡(White Castle)开发语音驱动的直通车服务相关。鉴于过去几年间,劳动力市场动荡不安,快餐公司忙于利用人工智能技术实现自动化生产,其中也包括麦当劳。事实上,这家快餐连锁店正与丹佛的Valyant AI合作,Valyant AI是一家初创公司,它开发了一个交互式人工智能语音系统接收客户订单,再合并到销售网点系统中。因此,零售业一定存在利益竞争。

SoundHound customers
逐渐增长的客户群 来源:SoundHound

另一个目标市场是物联网(IoT),但竞争更为激烈。Alexa已拥有大约70%的智能家居设备份额,其次是谷歌,约占四分之一。得益于现有的合作伙伴关系和迅速增长的客户群,SoundHound在汽车领域站稳脚跟。市场调研公司Voicebot.ai的数据表明,去年美国车载语音助手用户总数接近1.3亿,每月活跃用户达8380万,几乎是拥有智能音箱人数的两倍。

SoundHound声称,其产品合作生态系统中每月处理超过1亿次查询,是去年的两倍,预计年底将超过10亿次。

SoundHound的收入来源

那上述这些如何转化为实际收入呢?SoundHound通过以下三种方式获益:

  • 版税:车载、智能音箱、家用电器或其他设备安装Houndify软件,SoundHound会根据播放数目、播放方式或收听时长收取版税。
  • 订阅:SoundHound在执行服务时收取订阅费,如订购难吃的白城堡汉堡。
  • 货币化:综合前两种收费方式。购买语音产品的用户访问相关服务时,SoundHound获取服务费,一部分用于推广和交易,与产品制造商共享收益。

想象一下,一位安装了语音助手的汽车司机因为醉酒下了订单,而白色城堡是凌晨2点唯一开放的餐厅。餐厅向SoundHound付费,实现公司业务与汽车之间的无缝交易,SoundHound与汽车制造商共享这笔交易利润。理论上讲,各方都很满意:餐厅销售顺利,汽车制造商获得收益,SoundHound产品得到了推广,而顾客早上也不会因宿醉而难受。

总结

几年前,投资者在投资人工智能市场时选择余地不多。对于那些格外看好NLP技术的人来说,目前情况也类似。微软正在收购全球最大的人工智能语音识别公司Nuance,近年来该公司专注于医疗卫生领域。此外,还有法律科技(legaltech)市场上的电子签名服务巨头Docusign,它使用NLP和机器学习帮助查找、筛选和分析合同协议。不久后,NLP将加入每个公司的工具栏。

如果SPAC合并如期进行,SoundHound将以新的股票代码SOUN在纳斯达克上市。

本文来自互联网,不代表前途科技立场,如若转载,请注明出处:https://accesspath.com/tech/5701646/

(0)
陆思佳的头像陆思佳
上一篇 2021年12月10日 下午3:24
下一篇 2021年12月10日 下午6:58

相关推荐