AWS用新方法改良自然语言模型，让Alexa语音辨识错误率降低15％最新消息

AWS用新方法改良自然语言模型，让Alexa语音辨识错误率降低15％

消息来源:baojiabao.com 作者: 发布时间：2024-05-18

报价宝综合消息AWS用新方法改良自然语言模型，让Alexa语音辨识错误率降低15％

Alexa总是听错你说的吗？AWS最近透过新方法来改良自然语言模型，使Alexa的语音辨识错误率降低15％，AWS研究团队也将该研究成果发表于IEEE口语科技研讨会，自然语言模型是语音自动辨识系统的关键元件，自然语言模型会根据统计的相似性，撷取特定字串的文字，因此，该模型能够辨识相同声音序列不同的表达，当模型理解上下文的语境时，语音辨识系统的准确率就会比较高。

当语音服务加入新功能时，会建立一组新的上下文内容，并更新相关的自然语言模型，但是建立自然语言模型需要有大量的训练资料，而新功能通常没有相关的训练资料，因此，多半是透过正式的语法来产生简单的语句，这样的方法能够产生足够的训练资料，但是非常耗时，所以替代方案则是用语法输出的随机样本当作训练资料。

AWS透过一套特殊的算法，能够用语法规则的图像特征分析成特定的数学表征（representation），并直接计算语法产生任何字串的相关性，此外，AWS也直接透过语法将现有的语言模型，整合至新的语言模型中，如此一来，就不会降低已建立的模型效能。在研究实验中，AWS研究团队针对相同语法的输出，进行采样并建立语言模型，透过新方法建立的语言模型，能够让语音辨识系统错误率下降15%。

在自然语言模型的研究中，一个语法会包含掌管替换单词和词组的规则清单，例如，“我想要”的词组可以与“需要”或是“想要”等单词替换，其他规则则是单词连接实体名称，像是歌名会与“播放”连结在一起，一般来说，自然语言研究人员会用有限状态转换器（finite-state transducers，FSTs），用节点或是圆圈与线来描绘语法关系的网络，AWS则是用这些计算出来的概率来建立语言模型。

首先，AWS建立的算法会先辨识经过FSTs编译过文字内容的每个字串，再分析每个字串在网络图中的路径，利用概率和这些路径来计算特定字串的频率，接着，为了整合到现有的模型中，AWS用机器学习系统挑选出两个模型中最佳化的结果，最后，AWS利用3种不同的自然语言理解功能来评估模型，分别是查询股票价格、查询食谱和烹饪指示，和预定机票，结果显示透过该方法针对语法的复杂性，预定机票的能力提升了15%。

2018-12-14 17:34:00

AWS用新方法改良自然语言模型，让Alexa语音辨识错误率降低15％

品牌选车