APP下载

【台湾人脸辨识实例:中华电信】千分之一少数是关键,百万人脸AI仍须在地图库才够准

消息来源:baojiabao.com 作者: 发布时间:2024-05-14

报价宝综合消息【台湾人脸辨识实例:中华电信】千分之一少数是关键,百万人脸AI仍须在地图库才够准

年初时,中华电信研究院已将自家人脸辨识引擎,先用来管理总公司内部数百名委外清洁员工的上班出勤,现在每位人员上下班,都会先通过一台刷脸打卡机来进行签到或是刷退,以取代传统上下班打卡。(摄影/洪政伟)

十年研发,搜罗全球百万张人脸照片训练的脸部辨识引擎,遇上自家员工的脸,竟然出了状况。去年10月,中华电信研究院信心满满地展开了一项实测计划,在实验室测试辨识度高达99%的脸部辨识引擎,却在辨识员工人脸时,效果大打折扣,常常会认不出来。

用了全球人脸公开数据库训练,准确率有世界级水准的自制脸部辨识技术,实测为何失准?他们灵机一动,改换用在地人脸,仅增加数千张亚洲脸孔,在辨识人脸时就有了近1成的提升,甚至还比原先百万张国外人脸训练的模型辨识效果更好,大大改善了原有台湾人脸辨识度的不足。该院巨量资料研究所所长汪世昌说:“这正是人脸辨识要在台湾落地的应用关键,只有用台湾人脸资料,才能打造出最符合在地化使用的人脸应用。”

引进当红的深度学习技术,1年内就让人脸辨识准度明显提升

负责中华电信自主技术研发的中华电信研究院,从事AI影像辨识研发长达10多年之久,约2008年左右开始投入人脸辨识技术开发,不过一开始,仅以传统机器学习技术(如LBP)来进行人脸模型训练时,辨识度最高仅有8成,难以达到商用的水准,直到2年前,引进当红的深度学习技术后,短短1年内,就让自家人脸辨识准确度有了大幅度提升。

汪世昌指出,深度学习技术的出现,解决传统算法的诸多瓶颈,像是对于表情、年龄、化妆、戴眼镜等脸部不同变化,准确度就比传统人脸辨识技术来得高;另外,对于光影、人脸角度的变化,也有更高的辨识容忍度。更重要的是,借由大量资料进行训练,就能持续改善模型的辨识率。

但想要提升辨识率,训练资料就要越多越好,汪世昌也大方分享自家经验,在LFW测试(公开人脸资料集评比)上,大约20万张人脸训练资料,TAR辨识率就可以达到98%,但他进一步指出,想要在提高辨识度,接下来就只能靠资料量与技术上来突破。

因此,在技术上,中华电信采用深度学习的CNN(卷积神经网络)技术,搭配TensorFlow机器学习框架来进行人脸辨识模型开发,一举将脸部辨识提高到九成八的辨识率,这还只是使用2千多人共计20万张人脸资料进行模型训练的成果。接下来,再从原先2千人增加到1万人,训练资料量也翻了3倍,以多达60万张人脸影像进行训练,辨识率也因此在短短不到1年内,就推升到99%以上,“如今,我们的训练人脸资料已达到100万张,在进行LFW测试时,辨识率高达99.78%。”汪世昌说。

在训练摸型的同时,中华电信研究团队还针对人脸影像进行校正、调校尺寸,来持续优化模型提高认脸能力,甚至还开发自动过滤算法,增加训练可用的大量人脸至4万人。汪世昌也透露,为了要缩短模型训练时间,还引进了运算力更强的硬件,如要价不菲的深度学习专用硬件DGX-1等,来加快深度学习模型的训练,以百万张人脸为例,他说,原先每次训练模型最少要花3天,现在,只用不到1天就能训练完,开发人员可以更快观看测试结果与进行模型参数调效,来持续优化模型,让它的辨识效果可以越来越好。

中华电信研究院巨量资料研究所所长汪世昌认为,当人脸辨识的辨识率已达到98%或99%以上时,产业应用才是发展重心,想让人脸辨识可以落地为实际应用,在地化人脸资料是关键。(摄影/洪政伟)

要用当地脸部资料做训练,人脸辨识模型才能更贴近在地需求

但是,就算测试辨识效果再高,并无法真正反应出实际应用场景也是如此,汪世昌就认为,当人脸辨识的辨识率已达到98%或99%以上时,产业应用才是接下来的发展重心。“而要让人脸辨识可以落地成为实际应用,在地化人脸资料是关键。”他说。

他也以自家人脸辨识引擎来说明没有在地人脸资料的影响有多大。去年底,研究院在内部展开一项实测时,却发现原本在实验环境测试辨识率有高达99.6%的人脸辨识模型,却认不太出自家员工,甚至辨识率连8成都不到。更进一步分析才发现,这些辨识容易出错的人脸影像,大多是属于侧脸,而不是正脸,甚至只要脸部角度稍有偏差,就容易被误认成别人或无法辨识,但认外国人脸时,就几乎没有这个问题。

但改加入了亚洲人脸孔资料后,再重新对员工来进行辨识,汪世昌表示,结果就完全不一样,马上就有了明显的改善,辨识度从原先低于80%,进而提升到了87%~88%,甚至比原本百万张人脸训练出来的模型还提高了近1成的辨识率,这也才仅花了数千张亚洲人脸当作训练样本。汪世昌指出,这次学到的教训,也让他们决定要建立台湾自己的人脸数据库。

因为一开始搜集的一百万张人脸资料,绝大多数都是外国面孔,这正是造成训练出来的模型辨识亚洲人会不准的原因,他解释,因为这些西方人脸五官通常较为立体,相较之下,东方人脸轮廓较为扁平,因此,以这些脸部资料训练开发出来的人脸辨识引擎,辨识出来的结果,就容易会有差异。

但是,想要让人脸辨识在台湾落地且能够广泛应用,就不能只会认正脸,就连侧脸,或甚至不同脸部角度也都要能正确识别。因此,为了解决这个难题,他表示,才要增加训练用的台湾或东方人的脸孔, 要让自家人脸辨识引擎,不再只认得外国脸,也能认台湾脸。

汪世昌也强调:“台湾要发展人脸辨识,只有用自己在地人脸资料下去训练,才能发展出符合台湾在地化的人脸应用。”尤其是,未来只要是需要身份验证的场所,都会是人脸辨识的应用范畴,但辨识过程中需要人脸特征值做分析且涉及到个资隐私,需要高度资安保护,透过自行开发掌握关键技术,才能够确保资安与个资保护。

年初院内已导入刷脸技术,委外员工出勤打卡先用

年初时,中华电信研究院也使用这套在地人脸辨识引擎,来开始管理总公司内部数百名委外清洁员工的上班出勤,现在每位人员上下班,都会先通过一台刷脸打卡机来进行签到或是刷退,以取代传统上下班打卡。

这台人脸打卡机就放置在门口警卫室旁出入走道,只要按下签到键,以正脸面向镜头就会回传照片到后端注册人脸数据库比对,大约2秒就能回传辨识结果,一旦确定是本人,就会在屏幕上显示姓名、完成签到时间。

除了自己内部使用外,中华电信今年5月也推出商用服务,目前已有台湾高科技业、建筑业与-部门采用,做为门禁、差勤管理的使用,另外也有花莲大型购物中心,用于分析来客人流或VIP顾客识别等应用。

2019-07-11 10:46:00

相关文章