APP下载

AWS用新方法改良自然语言模型,让Alexa语音辨识错误率降低15%

消息来源:baojiabao.com 作者: 发布时间:2024-05-18

报价宝综合消息AWS用新方法改良自然语言模型,让Alexa语音辨识错误率降低15%

Alexa总是听错你说的吗?AWS最近透过新方法来改良自然语言模型,使Alexa的语音辨识错误率降低15%,AWS研究团队也将该研究成果发表于IEEE口语科技研讨会,自然语言模型是语音自动辨识系统的关键元件,自然语言模型会根据统计的相似性,撷取特定字串的文字,因此,该模型能够辨识相同声音序列不同的表达,当模型理解上下文的语境时,语音辨识系统的准确率就会比较高。

当语音服务加入新功能时,会建立一组新的上下文内容,并更新相关的自然语言模型,但是建立自然语言模型需要有大量的训练资料,而新功能通常没有相关的训练资料,因此,多半是透过正式的语法来产生简单的语句,这样的方法能够产生足够的训练资料,但是非常耗时,所以替代方案则是用语法输出的随机样本当作训练资料。

AWS透过一套特殊的算法,能够用语法规则的图像特征分析成特定的数学表征(representation),并直接计算语法产生任何字串的相关性,此外,AWS也直接透过语法将现有的语言模型,整合至新的语言模型中,如此一来,就不会降低已建立的模型效能。在研究实验中,AWS研究团队针对相同语法的输出,进行采样并建立语言模型,透过新方法建立的语言模型,能够让语音辨识系统错误率下降15%。

在自然语言模型的研究中,一个语法会包含掌管替换单词和词组的规则清单,例如,“我想要”的词组可以与“需要”或是“想要”等单词替换,其他规则则是单词连接实体名称,像是歌名会与“播放”连结在一起,一般来说,自然语言研究人员会用有限状态转换器(finite-state transducers,FSTs),用节点或是圆圈与线来描绘语法关系的网络,AWS则是用这些计算出来的概率来建立语言模型。

首先,AWS建立的算法会先辨识经过FSTs编译过文字内容的每个字串,再分析每个字串在网络图中的路径,利用概率和这些路径来计算特定字串的频率,接着,为了整合到现有的模型中,AWS用机器学习系统挑选出两个模型中最佳化的结果,最后,AWS利用3种不同的自然语言理解功能来评估模型,分别是查询股票价格、查询食谱和烹饪指示,和预定机票,结果显示透过该方法针对语法的复杂性,预定机票的能力提升了15%。

2018-12-14 17:34:00

相关文章