APP下载

让 AI 语音“个性发声”,有道语音合成功能重磅升级

消息来源:baojiabao.com 作者: 发布时间:2024-05-19

报价宝综合消息让 AI 语音“个性发声”,有道语音合成功能重磅升级

习惯了在导航里听"志玲姐姐"温柔的指示,也习惯了和不动声色的 Siri 交流,有没有想过换上自己的专属 AI 声音,在独一无二的情境中实现智能交互?日前,网易有道全新升级语音合成的声音定制和声音复刻功能,从录制到试听整个过程只需要 5 分钟,即可让私人订制的 AI 声音为你"开嗓",在日常生活的多种用途里"个性发声"。

语音合成,即 TTS (Text-To-Speech),是将文字转化为声音并且朗读出来,让机器生成自然动听的人类语言。近年来,随着 AI 技术的发展,越来越多的 AI 合成声音被企业接受并投入商用。例如,网购时的智能客服和开车时的语音导航,都是现代人再熟悉不过的 AI 之声。然而,制约这一技术大规模应用的桎梏在于,过往亲近人类的语音合成需要签约配音员进行录制和标注,再加上一定的训练时间,使得整个过程不仅周期长,收费也不便宜。

为了突破这一瓶颈,网易有道上线了声音定制和声音复刻功能,这是语音合成技术 (TTS) 的个性化应用,以科技进展把复杂的事情变得简单:通过在平台录制 5-20 句话,得到与用户本人在音色和发音风格上相似的声音模型,从而快速地复刻(定制)用户原声。在很短时间内,有道的声音复刻技术就能完成文本分析、声学模型和声码器三个关键步骤,依托神经网络和迁移学习技术,让音色达到很高的还原度。从录制到试听的整个过程,只需要 5 分钟。

这是网易有道 AI 技术赋能生活的又一生动实践。目前,语音合成已经融入日常工作生活的方方面面,从智能客服到语音导航,从孩子听故事、用户学习陪伴的情境,到元宇宙的虚拟角色的自我表达,都需要一个有温度的"科技好声音"-- 此前,有道 AI 语音团队 4 人小组用了半个月的时间,将明星欧阳娜娜时长仅几十分钟的语料完美复刻,创造出了以假乱真的惊艳效果。从此,AI"欧阳娜娜"得以全天候陪伴用户学习英语,让更多人看到了大众偶像助力个人学习的可能。

图:有道词典明星语音功能界面示例

为了让用户轻松体验到这项技术,网易有道专门研发了有道智云-个性化语音定制平台,只需登录有道智云 AI 开放平台,打开有道声音定制页面,依次点击"智能语音服务""个性化语音定制"和"免费试用",在安静的环境中说不低于 5 句话、5 分钟左右即可生成自己的专属音色。活动期间,每个用户均可在有道智云 AI 开放平台官网免费体验 3 次,定制 3 个语音。

据悉,个性化语音定制已在有道词典、有道乐读、导航播报等多种产品中广泛应用,让用户能以最喜欢的声音为伴,来为自己的学习、工作和生活锦上添花。试想,孩童可以在妈妈的 AI 声音中听完一整本童话,粉丝可以被偶像的 AI 声音激励着刻苦学习,这也是网易有道一直以来的愿望:为人与人的美好互动贡献力量,让教育科技充满人文关怀,走进日常生活的每一个角落。

2023-01-06 14:30:23

相关文章