Relate的前身是人工智能语音识别技术Project Euphonia。2019年,谷歌首次官宣Project Euphonia及其部分研究报告。谷歌的研究科学家迪米特里·卡内夫斯基Dimitri Kanevsky主要负责此项技术。卡内夫斯基本人也存在语言障碍,为基于人工智能的解决方案提供了一手资料。现在,奥布丽·李Aubrie Lee作为Relate的主要合作伙伴和用户之一,同时也是Relate的市场营销员。由于严重的肌肉萎缩症,其他人和Relate都难以与她沟通。
事实上,语音识别引擎需要学习大量语音数据才能准确翻译,且所需数据支持通用语音模式。这些数据集表明,有口音的人本就表现不佳,所以他们难以被理解——而有语言障碍的人更少见,其结果是他们几乎不可能使用普通的语音设备。
基础技术的创新和改进帮助人们进一步与发音不标准的人沟通。然而,对残疾人士极具个性化的语言系统进行收集和分析需要付出巨大努力。每个人的声音都是独一无二的,机器学习系统很难准确理解那些罕见独特的语言模式,比如中风或受伤导致的语言系统受损。
Relate包括三大核心功能,可帮助有语言障碍的人与他人交流。“Listen”功能可将用户的语音转换为文本,供用户发送、复制并粘贴到其他应用,供他人阅读。“Repeat”功能则能以清晰的语音重述用户所说,从而使面对面的互动更加完美。此外, “Assistant”功能与Google Assistant连接,执行“播放音乐”、“天气播报”等常见指令。
Relate与其他机器学习系统一样,容纳的数据越多,数据到个体用例越具体,达到的效果就越好。为了更好地实现这些功能,谷歌首先需要收集大量数据。对此,研究人员表示,为了提高人工智能对语音识别能力,他们建立了一个数据库,专门收集志愿者提供的语音样本,当前数量已超过一百万个。
谷歌产品研究经理朱莉·卡蒂奥Julie Cattiau说道,“因为语言障碍者的群体多样化,所以人们使用Relate的方式可能会有所不同。为避免假设目标受众的需求,我们选择与用户共同设计产品。通过第一批目标用户的测试,我们更好地了解了该应用的操作方式、准确程度以及提升空间。推广之前,我们还会进行一些改进。”
用户一打开应用,就会被要求念一组短语,系统会将其记录下来,以更好地适应使用者的语音模式。谷歌公司目前在招募第一批亲身体验的用户,要求是定期使用该应用。如果用户认为这对他的日常生活很有帮助,就可以申请注册成为志愿者,或许用户能通过Relate帮助到更多的人。
本文来自投稿,不代表前途科技立场,如若转载,请注明出处:https://accesspath.com/tech/5695412/