APP下载

Google强化智慧回复功能,已可支援具复杂语言切换特性的YouTube评论

消息来源:baojiabao.com 作者: 发布时间:2024-03-29

报价宝综合消息Google强化智慧回复功能,已可支援具复杂语言切换特性的YouTube评论

Google现在将原本应用在Gmail和Android上的智慧回复功能(Smart Reply)扩展到YouTube Studio上,供创作者能够更方便地与观众互动。目前这项功能还只支援英文和西班牙文,但Google提到,由于使用单一跨语言的模型,因此能够简化扩展至其他语言的过程。

智慧回复是运用人工智能技术,产生回复讯息建议选项给用户,用户能够直接使用或是修改,以快速回应来讯,Google提到,由于YouTube创作者会在影片下收到大量的回复,而且观众可能来自不同的社群,智慧回复功能协助创作者回应观众的评论,以及进行讨论等互动

不过,应用在Gmail和Android的智慧回复模型并不能直接搬到YouTube上使用,因为电子邮件的用语通常更为正式严谨,YouTube的评论存在更复杂的语言切换模式,并大量地使用表情符号,且观众对缩写、惯用语以及标点符号使用习惯不一致,这些原因都让Google在YouTube中添加智慧回复功能充满挑战。

最一开始Google在Inbox应用程序中提供的智慧回复,是使用递回神经网络逐字对输入的电子邮件进行编码,并使用另一个单词等级的递回神经网络以解码可能的回复,Google提到,这种方法的计算成本很高,因此后来Google设计了一个检索系统,透过搜寻预先定义的建议列表,找出最适当的回应,就能以更少的计算达到相同的功能。

这个检索系统让Google得以将智慧回复功能扩展到Gmail,并且也成为了当前YouTube中智慧回复的基础,不过,过去的智慧回复系统仰赖单词等级的预处理,这种方法只在有限的语言以及较严谨的写作风格有用,但YouTube中存在太多表情符号、ASCII艺术和语言切换等异质内容,因此Google决定在YouTube使用案例中,不在编码文字前进行任何预处理,而研究也证明,Transformer网络能够对字元长序列进行建模,并获得与基于单词的模型相同的品质。

虽然这个初步结果,对于处理带有表情符号或错字的评论,有很不错的效能,但是因为Google是以字元长序列直接进行建模,比单词还要长得多,因此运算也更复杂,使得模型预测速度无法用于生产环境中,后来Google借镜讯号处理模型WaveNet中的膨胀技术,在神经网络的每一层都缩短一点字元序列长度,最终在运算速度和品质中取得平衡。

Google没有为每种语言都训练单独的模型,而是训练一个跨语言的模型,Google提到,单一跨语言模型能够更好地处理YouTube评论中语言混用的情况,并使得模型能够利用一种语言中常见的元素,来理解另一种语言,而且只用一个模型,就能够简化维护和其他后续的工作。

目前这个模型已经能够支援英文和西班牙文,但是其灵活性也能够扩展支援其他语言,这种特性在Google还没用平行语料库训练模型就已经出现,把模型对英文评论“这是一个很棒的影片”的回复进行分群,阿拉伯文、英文和西班牙文相近的回复,在图表的距离相当接近,不同语言但意义相似的回复,会在图表中出现跨语言的聚类。

2020-07-02 18:19:00

相关文章