APP下载

【寻找在地AI技术力】台湾的中文语音引擎在哪里?(下)

消息来源:baojiabao.com 作者: 发布时间:2024-04-19

报价宝综合消息【寻找在地AI技术力】台湾的中文语音引擎在哪里?(下)

台湾IC设计商威盛电子旗下品牌欧拉蜜(Olami),开发了一个中文语音助理,不只能用普通话沟通,也听得懂台语,还提供智慧喇叭开发套件,让企业或开发者能设计出客制化声控装置。(图片来源/翻摄自Olami官方影片)

 【寻找在地AI技术力】台湾的中文语音引擎在哪里?(上)文章连结 

但同样也是说中文,中文还是我们的母语,台湾难道没有一套能用的中文AI语音引擎吗?

其实不然,iThome记者亲自走访一轮发现,台湾是有的,而且厉害的人也不少,只是一直以来都默默耕耘,没有被看见。连曾负责开发微软个人语音助理Cortana,2年前回来成立台湾AI实验室的杜奕瑾都说:“我们已经做到了,可以来找我们。”

工研院早从二十多年前就开始从事台湾中文语音研究,2年前更公开展示过一个能听懂台湾国语的个人语音助理,用的就是他们自行开发的中文AI语音引擎。台湾老牌喇叭制造商淇誉电子去年更延揽这个开发团队,协助开发在地化的智慧喇叭,之后也将搭载在该公司与中华电信合推的智慧喇叭上。

另一家台湾IC设计商威盛电子旗下AI人机互动品牌欧拉蜜(Olami),同样也有开发一个在地的中文语音助理,而且不只能用中文沟通,去年也开始可以听懂台语,使用者还可以用道地的台语腔来向它点播歌曲,并且还提供了一个智慧喇叭开发套件,让企业或开发者能用它设计出自己想要的声控装置。

不只传统音响或IC公司,台湾也有越来越多的AI新创生力军投入,如台湾AI实验室去年底自行研发推出一款在地化的语音辨识App,名为雅婷,能即时听辨中文语音,再转成文字,有别国外的语音辨识,因为是利用台湾在地化的中文语料做训练,可以更符合台湾在地人的讲话习惯或说话方式,甚至连台湾批踢踢(PTT)上常见的乡民用语都难不倒它,一推出就引起热烈回响,短短一周就攻占Android手机平台,成为生产力类最受欢迎App。

以前只有指令式语音辨识的本土语音辨识商赛微科技,4年前也开始针对语音指令结合中文自然理解处理能力,让使用者可改用更自然地口吻说话,而不用像看说明书一样,一个口令、一个动作。甚至,后来更结合深度学习技术,持续搜集在地语料让语音辨识准度做得更好。目前也有跟台湾电商合作,用于网络语音购物。去年该公司还成立语音助理开发团队,未来也将针对语音辨识推出自然语言处理(NLP)自动化工具,要让企业上手更容易。

中文NLP研究常用到的自动化中文断词工具,实际上,中研院CKIP Lab中文词知识库小组自己也有一套国产品,但以前没有开源,很多人只好换用中国开源的中文断词工具Jieba(结巴)。不过,中研院从去年开始释出技术,要让用的人更方便,甚至未来4年,还要加入所有中文维基百科语料,搭配现有中研院将近9万词汇的语料库,来打造一套百万中文词汇知识库,要提供给台湾企业或厂商来使用。

台湾在地化AI语音引擎的挑战

不过,语音Chatbot和智慧喇叭搭载的个人语音助理,在应用上还是有些不同,有别于特定领域为主的Chatbot,语音助理比较像是通用型Chatbot,应用场景更复杂,更需要累积大量背景知识,才能依据不同对话场景,如家中、办公室,甚至是户外场所,来对使用者做出相应的回复,或是依指令执行特定任务。例如“今天到百货公司买衣服,第2件5折”,如果机器人没有“优惠折扣”这个背景知 识,就没办法做出相对应的回应。

再者,有别于文字,语音需要先将声音转成文字,再从文字去理解。这也涉及到了语音转文字,甚至是语音合成的技术。前者语音辨识的准确度也会影响后面语意分析的效果,能不能真正理解使用者说话的原意,这需要透过搜集大量录制的声音资料来训练语音辨识模型,才能让它辨识度可以越来越好。或是想要让语音合成的声音,不要听起来像机器人念稿,缺少人性,需要透过机器学习来理解词汇前后的关系,再来决定这个音该怎么发,才能听起来更亲切。这并不是件容易的事,也大幅增加企业进入的门槛。

台湾虽然有自己的中文AI语音引擎,技术上厉害的人也不少,但也有未成熟或不足的地方,甚至还面临到中国的严峻挑战,使得企业目前在选用上还是多以国外或中国厂商为主,例如台湾现在较少有能提供像中国这样的中文AI语音技术完整解决方案,包含语音辨识、语意理解到后面合成串接在地服务,而且不少语音产品开放技术权限不够多,企业想要客制自己的语音功能,例如说话声调,或更多互动,只能自己想办法,这也使得想要用的企业,现在只能先拿国外甚至中国的AI语音引擎来用。

不少专家都预言,语音互动很有可能会是未来下一个应用程序或装置互动界面,将成为不只喇叭,连各种IoT装置都能用的新一代对话互动界面。台湾应该也要有自己的中文AI语音引擎技术,因为这不仅仅是企业在地应用突破的关键,更是台湾AI技术力能不能被世界看见的重要软实力。

【业界观点:淇誉电子副总经理何志宏】只用国外语音引擎消弱台湾AI技术力

 

台湾要发展在地的中文AI语音引擎,不能只靠旧的中文语料训练,而是需要不断有布建到外面的装置,持续蒐进各类语音对话资料产生的新语料,才可以让它变得更聪明,更贴近现在民众的使用习惯、说话方式。

这也是Google 、Amazon现在正在做的事,要将自家的AI语音引擎布到不同IoT装置上替它蒐语料。

一旦台湾自己的智慧喇叭,装进的是国外的AI语音引擎,再卖给民众来使用,淇誉电子副总经理何志宏直言:“这就等于是我们在帮别人产生训练用的中文新语料,让对方的AI语音引擎变更聪明。只会让台湾AI技术力更落后。”

甚至,也因为AI语音技术是用别人家的,等于是自己的核心技术命门,一直被别人掐住,以后想要做任何新服务,都很容易会绑手绑脚,得要符合对方的规格行事,不但无法自己主控,甚至很多应用开发上,就会慢别人很多拍。

【专家观点清大资工系教授张俊盛台湾要做先进NLP研究至少要有10亿词汇语料

台湾想要发展更先进的自然语言处理(NLP)技术,就需要有大量在地中文语料,但是长期在台湾从事自然语言处理研究的清大资工系教授张俊盛坦言,目前台湾很多在地语料都要不到,尤其是新闻报社和出版界的中文语料,过去累积了大量的中文资料,但都不愿公开,“国内要做学术研究时,还得大老远跑到美国拿,这是很荒谬的事情。”

如果想要从事更先进NLP研究,张俊盛认为,需要建置的中文语料库规模最少要达到10亿词,而且语料太旧还不行,另外资料品质也要合乎标准,且兼具多样性。

他更提到,台湾目前缺乏建立一个语料库共享平台,如美国LDC共享语料库等,可以让各学校取用,拿来做自己的NLP研究,连台湾的中文语料也搜集,包括10亿字中央社新闻语料库等。

若在台湾各校要研究使用的话,现在只能各自建自己的中文语料库,等于是大家都在重复做同样的事情,研究进展上,势必就会落后别人。

2019-02-20 12:36:00

相关文章