APP下载

捐出你的声音!Mozilla开源语音资料专案CommonVoice开始募集繁体中文音档

消息来源:baojiabao.com 作者: 发布时间:2024-05-17

报价宝综合消息捐出你的声音!Mozilla开源语音资料专案CommonVoice开始募集繁体中文音档

为加速语音辨识相关技术及应用的发展,Mozilla去年发起开源语音募集专案Common Voice(同声计划),在6月底开始募集繁体中文音档,鼓励民众献声,以协助繁体中文语音数据库的建立。

去年7月启动的Common Voice专案,目的是收集训练语音辨识所需的语音资料,根据Mozilla统计,迄今已有超过200位开发者参与这项计划的软件开发,目前已募集112个国家超过2.4万人贡献的声音,搜集超过900个小时的语音资料,是全球仅次于磁带书LibriSpeech数据库的全球第二大开源语音数据库,预估年底可望成为全球最大的开源语音数据库。

Common Voice专案已有60种语言版本,但由于人手不足,现在已开始收集15种语言的语音档,除了英文语音外,6月开始募集德语、法语、威尔士语录音档,繁体中文语音也在6月底开始募集。

带领Common Voice专案的Mozilla开放创新部门数位策略师Michael Henretty表示,语音辨识不仅要能辨识语言,还要能理解自然语言,由于辨识涉及深度学习,需要昂贵的运算系统、大量的语音资料,目前的语音助理技术大多掌握在几家大厂手中,商业化的语音辨识技术也忽略非主流语言的声音,Mozilla希望透过Common Voice收集不同国家、语言、性别或年龄的声音建立一个全球最大的开源语音资料集,让语音辨识术能够民主化,也为没有受过教育、视障者、儿童或老年人等弱势族群降低资讯存取的门槛。

目前该专案已募集超过900小时的音档,以英语音档最多,去年底至今年初Common Voice已开放英语资料集下载,为方便外界使用,采用CC 0授权。至于非英语的其他语言,法语及德语各有约50个小时音档,繁体中文在6月底才刚开始募集,为亚洲地区第一个展开募集的语言,现在已有36小时音档。

非英语的语言资料集目前尚未开放,Michael Henretty表示,英语的语音资料集在募集的6个月后开放,至于繁体中文的资料集何时会开放,目前还没有明确的时程。Common Voice专案希望未来募集足够的语音资料后可以稳定的发布语音资料集的更新版本。

Common Voice专案的理想目标,是希望能够尽量收集到不同国家、不同语言,不同性别、年龄层的语音资料,如此才能让资料集发挥更大的效用,以该资料集打造的语音辨识技术能够正确辨识语音。至于需要募集多少的语音资料,Michael Henretty认为如果能够募集到1万个小时,相信能让运用Common Voice的开源语音资料集的语音辨识技术做到和Google相近的水准。 

专案收集到语音资料除了和Mycroft、Snips.AI、威尔士的Bangor大学等新创或学校进行语音相关技术的合作外,资料也会运用在Mozilla的语音辨识引擎“深度语音辨识”(Project DeepSpeech)专案上。

有兴趣捐出自己声音的民众可以前往网站,iOS用户可以下载app利用手机录制音档,Android用户则可以手机浏览器。如下图所示,民众进入Common Voice募集网页后,可点选“说话”,依照指引对着麦克风念出屏幕上秀出的中文字句,或是点选“聆听”协助校正,系统会秀出一个中文句子并念出声音,使用者协助确认念出的语音是否和句子相符即可。

2018-07-19 13:31:00

相关文章