APP下载

Mozilla“同声计划”提升语音识别开放性与包容性将收录德语、法语等其他语言未来将包括繁体中文

消息来源:baojiabao.com 作者: 发布时间:2024-05-04

报价宝综合消息Mozilla“同声计划”提升语音识别开放性与包容性将收录德语、法语等其他语言未来将包括繁体中文

Mozilla在去年7月宣布启用“同声计划”透过收录大量语言声音资料,借此让语音识别为主的技术有更大开放性与包容性,让全球更多小众语言也能像主流语言一样被重视,并且使小种语言主要使用者也能透过熟悉交谈方式使用新技术。

去年7月启用“同声计划 (Common Voice)”收录大量英语声音档,借此让语音识别在内服务能以此训练更准确判断效果后,Mozilla稍早在宣布将于“同声计划”内加入收录德语、法语、威尔士语声音内容,未来更计划收录包含繁体中文在内超过40种语言。

为了让语音识别在内服务有更正确判断效果,Mozilla稍早宣布将使“同声计划”加入德语、法语、威尔士语在内声音内容,未来更准备加入包含繁体中文、西班牙文、印尼文和俄文在内超过40种普及语言,其中更包含菲士兰语 (Frysian)、挪威语、楚瓦什语 (Chuvash)在内小众语言,让这些相对较少人使用的语言也能被应用在语音识别、翻译,或是其他声控相关应用服务,进而缩减这些小众语言在网络等科技应用发展所处弱势情况。

以深度学习的角度来看,若是提供学习学习的参考范本充裕,将能让深度学习效果更加显著,因此以目前英语文本、声音资料充裕的线上服务来看,几乎都是对英语为主的使用者有利,尤其在声音资料内容部分,目前网络流通数据依然是以英语为大宗,因此许多数位助理服务多半都会支援英语,相对以中文、日文或韩文在内语言为主的数位助理服务几乎为少数。

因此,Mozilla决定在去年7月宣布启用“同声计划”透过收录大量语言声音资料,借此让语音识别为主的技术有更大开放性与包容性,让全球更多小众语言也能像主流语言一样被重视,并且使小种语言主要使用者也能透过熟悉交谈方式使用新技术。

而除了收录一般主流被使用语言,“同声计划”收录内容更包含各地方言,借由各地区愿意提供声音的捐助者进行内容阅读且完成录音,借此让不同语言能更有系统地以数字化行留存,对于少数语言保留也有相当大的意义。

回应 0
2018-06-08 13:33:00

相关文章