APP下载

让语言障碍的帕金森氏症、脑麻病患出门更容易与人沟通!Google新App能帮忙转译文字再合成语音念出声

消息来源:baojiabao.com 作者: 发布时间:2024-05-15

报价宝综合消息让语言障碍的帕金森氏症、脑麻病患出门更容易与人沟通!Google新App能帮忙转译文字再合成语音念出声

语言障碍者Aubrie Lee点餐时,已经能透过语音转语音的技术,由App正确覆述她的餐点内容,以便让店员理解。

图片来源: 

图/Google

全球有数百万人受到中风、渐冻症、脑性麻痹、脑部创伤或帕金森氏症等病症影响,无法发音正确且流畅的说话,导致说出来的话难以被他人理解。Google正在测试一款Android应用程序称为Relate,旨在协助语言障碍人士,让他们更轻松地和他人沟通,并能与Google语音助理互动。近日也征求来自澳洲、加拿大、新西兰和美国的英语测试人员,来进行Beta版测试。 

Relate计划从2018年展开,试图以语音辨识的技术,来改善语言障碍者说话难被理解的处境。Google AI部门产品经理Julie Cattiau指出,一般的语音识别技术,在缺乏非典型语料作为训练资料的情况下,无法辨识这类说话型态,所以Google语音与研究团队数年来召集语言障碍者参与研究,录制特殊语音样本,目前已经累积超过数百万笔特殊语料,来训练非典型语音辨识模型。

参与这项计划的其中一位语言障碍人士,就是Google的品牌经理Aubrie Lee,同时是Google身心障碍员工资源小组的主席,她患有肌肉萎缩症,导致语言能力受到影响。但从Google释出的影片可以看到,这款App已经能在Aubrie Lee点餐时,正确覆述她的餐点内容,以便让店员更容易理解她的意思。她也因此为App命名为Relate(诉说)。

Relate涵盖三大功能:聆听、覆述、启用Google助理

Google整合了核心语音识别模型与多项既有技术,开发了Relate应用程序。这款App涵盖三大功能。其一,是最核心的语音转文字功能(Speech-to-text),让使用者先录制约250~500组语音词汇,由AI引擎自动学习并训练出个人化的语音识别模型,来正确了解使用者独特的说话方式,并将语音转译为文字。

Julie Cattiau表示,录制500组词汇大约需要30~90分钟不等,但若录制了250组词汇后,模型准确度已经达到一定标准,则会提前释出模型来应用,“这取决于语言障碍者本身语态可被理解的程度。”

而这些需要预录制的词汇,也非使用者随机挑选,团队会从日常用语及Google语音助理常用词汇中汇整,再要求使用者录制。因此,这款App并不一定适用所有场景,比如使用者说出“mathematics(数学)”这个词汇时,App不一定能辨识出来,但使用者可以自行建立个人化的词汇,比如家人朋友的名字、特殊常用词汇等,扩大App可识别的词汇范围。“新增App需求之外的词汇,也能让模型变得更加坚固(robust)。”Julie Cattiau说。

App的另两项功能,则是整合了Google本身的相关技术,比如语音合成功能(Text-to-speech),也就是当使用者的特殊语音转为文字资讯后,App可将文字以清楚的合成语音重新覆述。App还能串接Google语音助理,让使用者透过App启动语音助理,来进行开灯、点播歌曲等操作。

之所以将特殊语音识别技术与Google语音助理结合,来启动多种操作,Julie Cattiau表示,“导致语言障碍的疾病,通常伴随着行动障碍,对使用者来说,更需要Google Home这类科技工具的辅助。”透过这款App,Google不只要让语言障碍者更容易与他人沟通,也要让其生活更加便利。

不过,这款App目前只支援英文,Google还在研究,如何将这项技术扩大应用到其他语言中。

2021-11-15 06:44:00

相关文章