APP下载

【世界冇秘密?】牛津发布读唇AILipNet助听障人士

消息来源:baojiabao.com 作者: 发布时间:2026-06-11

报价宝综合消息【世界冇秘密?】牛津发布读唇AILipNet助听障人士

听障人士要获悉外界资讯,读唇应是最直接的方式。牛津大学人工智能(AI)实验人员近日发布读唇 AI 系统 LipNet,准确率比人类高得多,究竟世上还有什么任务可以难到 AI?

一般人尝试读唇,大约每十个字才看懂一个字,即使曾接受专业读唇训练,表现亦因人而异。最近牛津大学发布了一个读唇 AI LipNet,可快速读取静音影片中的人物说话,并将之转化为文本,准确度更可高达 93.4 % ,比人类读唇专家的 52.3% 高得多。

然而, LipNet 系统却被指有严重的限制,未能应用于现实生活。整个 AI 系统的训练及测试均建基于一个数据数据库 GRID ,内含 29,000 条影片,当中 34 个自愿者在 3 秒短片中朗读无意义,且句式一样的句子,指令词汇及文法变化亦相当有限,因而被指夸大了研究成效。同时,LipNet 亦引起人们对隐私及监视的关注。

研究人员则反驳,指 LipNet 在庞大的数据下依然可维持良好表现,更大派定心丸,指 LipNet 需要在良好光线下才可清晰读唇,因此偷拍或监视别人并非易事。他们期望 LipNet 可协助改善助听仪器、在公开场合转译讲者的口述文字,甚至应用至 Siri 或 Google Assistant,让懒惰用家只需动动嘴巴,便可发出指令。

资料来源:The Verge, BBC News

2017-12-26 12:00:00

相关文章