APP下载

【专家剖析】机器人要如何理解中文

消息来源:baojiabao.com 作者: 发布时间:2024-04-20

报价宝综合消息【专家剖析】机器人要如何理解中文

中研院中文词知识库小组计划主持人马伟云(摄影/洪政伟)

在自然语言处理机制上,如何衡量机器人理解一句话时,通常是透过符号化的方式,来理解这句话的意思,也就是以自动化方式,对于这个句子进行标记后,看能不能跟以前标过的相似句子产生同样的语法、语义分析,还有背景知识结构的标记结果,如果一致,就可以说,机器人理解了这句话。

有别英文语言,机器人要看懂中文其实很困难,因为中文的语法结构松散,以达到语意沟通目的为主,所以一句话有时可以出现复数个动词,或是可以倒装语序,例如“苹果我吃了3个”,中文意思是“我吃了3个苹果”,“苹果”从受词移到主词前,听者还是懂;另外,也会出现许多省略用法,例如“我吃饱了”就算说成“吃饱了”,省略“我”也可以,但是英文就不行,这些语言上的用法差异,造成中文比英文更难理解,在人类学习是如此,机器人当然也是。

机器人要理解中文,主要有2种作法,前者是先断词,对于中文语意理解先建立一套自动化标记方式,再利用这套标记判断方法,来分析句子语法、语义结构和以前类似句子的标记是否一致;后者则是不需经过任何复杂的语法拆解、语义分析的标记,甚至也不一定要先断词,因为是将词汇转换成词向量(Word Vector)来表达,每一个词汇直接就是一个输入,然后经过计算各个字词之间的相似程度,得出这个词所要表达的语义,也就是输出,也是当前自然语言处理最热门的研究,也就是类神经网络深度学习技术,通过建立深度学习自然语言处理模型,从大量中文语料学习不同词汇所要表达的语义。不过,中研院中文词知识库小组计划主持人马伟云表示,目前多采混合,纯以深度学习方式来完成比较少见。

而先经过事前标记,再从这些标记后的中文句子语法、词性及词类等语义,抽取出需要理解的相关的重要特征,再喂进自然语言理解模型训练学习,从而理解句子所要表达的意思。尤其,对于需要从上下文脉络理解的自然语言处理中,找出这句话所要表达的真正意图时,马伟云表示,就可以透过这种方式来处理,例如多轮式对话(Multi-turn Dialogue)等。

2019-02-20 12:36:00

相关文章