APP下载

自然语言理解技术大进展!免断词,Google语意框架剖析器SLING能自动找出语句架构

消息来源:baojiabao.com 作者: 发布时间:2024-04-28

报价宝综合消息自然语言理解技术大进展!免断词,Google语意框架剖析器SLING能自动找出语句架构

Google最近开源释出实验性的语意框架剖析器(Parsing)SLING,有别于以往用断词的方式,SLING不需要靠人工的方式标注语句,而是可以透过语意框架(Frame Semantic Parsing)的方式自动抽取出文字所要描述的语意结构,再以语意框架图(Semantic frame graph)的方式呈现,Google研究团队表示,SLING是透过Tensorflow和Dragnn训练过的标注语料库,这是自然语言理解技术的一大进展,语意分析不再靠断词,而是从语言意义层面,自动标注出语句的结构。

SLING是采用一个特定用途的递归神经网络(Recurrent neural network,RNN)模型,在该框架图上,透过输入文字的递增编辑动作,来计算输出值,也就是说,该框架图因为灵活的特性,可以撷取多个语意任务,SLING的语意剖析器只用了输入词句来训练,没有采用额外的生成的标注,像是语句相依性分析产生的标注。

大部分的自然语言理解系统都是采用一种分析流程,从词性标注 (Part-of-speech tagging),到透过语句相依性分析(Dependency parsing)来计算输入的文字语意。这种模型较容易将不同的方析阶段模组化,但是往往也导致一个问题,一旦产生错误将会影响整个模型的预测。

SLING输出的语意框架图可以直接撷取使用者感兴趣的语意标示(Semantic annotation),也能避免系统流程中的设计缺陷,还能避免不必要的计算。

举例来说,传统的自然语言理解系统会先执行语句相依性分析的工作,最后才会执行指代消解(Coreference resolution),指代消解是将指定代名词还原为被替换的名词,来避免重要的字词因被替换为指定代名词,而在计算权重时降低的问题,如果语句相依性分析过程若有错误,将会连带影响最终输出的结果。

语意框架剖析的机制

语意框架代表语句的意义,也是一个描述,每个描述都被称为一个框架,该框架可被视为知识或是意义的单元,也包含了与其相关的概念或是框架的相互关系。SLING将每个框架组织成一个Slot的清单,每个Slot都有自己的角色或是名称,以及代表的值,该代表值可以是个字词的原意,或是与其他框架的连结。

例如,Many people now claim to have predicted Black Monday这句话,SLING先辨识语句的实体、测量值和其他概念,实体像是人物、地点,事件,测量值像是时间、距离,其他概念则包含动词,接着,将这些辨识出来的字词分类到正确的语意角色,当作输入值,因此,SLING会先将people视为人物框架、predicted是动词类别框架、Black Monday是事件框架,predicted这个动词表示为PREDICT-01框架,PREDICT-01框架与预测的主词Slot有相互关系,因此,PREDICT-01与PERSON框架连接,除此之外,PREDICT-01框架也与被预测的受词有相互关系,与Black Monday的EVENT框架连接。

Google研究团队认为,SLING透过语意框架,来训练并优化递归神经网络。神经网络在隐藏层中学习到的知识,可以取代了人工标注特征。

该语意剖析器的输入是以双向长短记忆单元(Bi-directional LSTMs)算法为基础的转换语意框架剖析方法,使用Transition Based Recurrent Unit (TBRU)来输出,结合成一个训练过的模型,只需要文字标注当作输入,经过转换系统,输出语意框架图形,不需要中间产生的标注(Intervening symbolic representation)。

输出层的文字在输出后,还会经过转换系统(Transition system),再重新进入输入层,其中,转换系统的一项关键机制是采用了固定大小的框架来记录字词对上下文预测的重要程度,也就是说,该框架是用来表示最近提及,或是在语句中被增强的关键字。Google研究团队发现,透过这个简单的机制,在撷取大量语意框架的关联上,效率提升有非常多。

目前,Google的研究团队表示,SLING是研究语意剖析的实验,Google已在Github将SLING开源释出,提供开发人员预先训练完成的语意剖析模型,可应用于知识萃取、解析复杂引用(Resolving complex references),以及对话理解等工作,未来,Google将会持续扩增SLING的功能。

2018-01-10 09:25:00

相关文章