APP下载

Build2018:微软释出可客制化的全新翻译器,更贴近行业别翻译需求

消息来源:baojiabao.com 作者: 发布时间:2024-04-16

报价宝综合消息Build2018:微软释出可客制化的全新翻译器,更贴近行业别翻译需求

微软最近在2018年的Build大会上推出可客制化的翻译器Translator text API V3,除了透过神经机器翻译(Neural Machine Translation, NMT)在翻译前撷取文章中整个句子,提供更高品质翻译结果,再透过更像人声的模式输出翻译结果,还提供用户建立和部署客制化的神经翻译系统。

微软表示,客制化的翻译系统功能不仅支援文字,也提供语音的翻译,NMT模型在特定业务和产业的翻译上有些许的限制,因为要重新训练一个特定的翻译模型需要很高的运算力,也需要许多成本和时间,但是高品质的机器翻译很重要的一个组成因素就是要做到客制化,提供适合企业所在产业或是专业术语的翻译结果。

举例来说,“Check”一词在不同的应用场景中,会代表不同的意义,银行中代表支票、在汽车产业中是指检验等,但是现在的翻译系统多半都将Check翻译成同一个结果,而微软这次推出新的客制化翻译功能更能辨识出这样的差异。

在每一对翻译的语言组中(如英文和中文),句子中的每一个字都会被转译为500个维度向量来表示该字汇的特征,根据训练资料,神经网络会自动定义每个字的维度,例如,性别的概念可以细分为男性、女性和中性等,词性可分为动词、名词等,但是在训练资料中,还是会有不明显的特征,系统会将这些词编译成更高的维度向量,用上下文和完整的句子来辨识单词的特征。

微软表示,NMT模型相当复杂,每种鱼研究有超过1,000万个参数,在训练模型的过程中不断进行调整,需要大量的训练资料和运算资源,一般的企业要自行训练出自己行业别的翻译系统是非常困难的。

微软指出,要训练出专属行业别的翻译系统,需要该领域2,000组对等语意句子资料集,像是人类翻译的结果,用越多资料来训练翻译模型,将会得到较准确的翻译结果,微软用业界评估翻译品质的标准BLEU score来比较通用型和行业别的翻译结果,结果显示客制化的结果品质较高。

除此之外,Translator text API V3还能一次翻译成多种语言,过去输入一种语言,只能翻译成另一种语言,现在不需要透过多个API就能根据单一语言的输入,翻译出多种语言。

另外,Translator text API V3也提供音译的功能,也就是说,若用户透过翻译器将英文翻译为阿拉伯语,但是用户不会阅读阿拉伯语,系统可以提供用英文字母书写而成的阿拉伯语。

新的双语字典功能可以显示从英文翻译或是翻译成英文的替代翻译结果,透过提供范例的字来让用户选择更好的翻译结果。

2018-05-09 13:31:00

相关文章