APP下载

为何脸部辨识需要大量在地人脸资料?

消息来源:baojiabao.com 作者: 发布时间:2024-05-14

报价宝综合消息为何脸部辨识需要大量在地人脸资料?

摄影/洪政伟

台湾很早就展示自主研发实力,甚至台湾第一套人脸辨识产品,早在10多年前就已问世,即使当时技术仍未成熟,应用受到局限,但也开启自主技术发展之路。甚至早在2013年时,台湾最大桃园国际机场率先启用的机场人脸通关查验机制,背后使用的正是国产技术。

2014年的深度学习的出现,更加快台湾脸部辨识技术发展脚步,不只让人脸辨识落地成为实际应用,也开始有跨领域的公司,用于机器人、门禁考勤等人脸应用,而且厉害的还不少,比较代表性的厂商如讯连科技、中华电信、研勤科技等,都在最近1年内推出自家的脸部辨识产品,甚至现在全球已有80万NAS用户,都在使用台湾群晖开发的人脸辨识侦测功能,来管理自己的相簿。

不只传统厂商,更有实力坚强的AI新创加入,如SkyREC,靠着自创人脸辨识算法,一次可侦测、辨识8千张人脸。就连原本只是使用者的金融业,现在也要转变成为技术提供者,像是台湾大型银行中国信托去年公开展示自行发展的ATM刷脸提款应用,不只认脸,还能侦测异常提款行为,今年下半年也将在新成立的数位分行ATM启用。

脸部辨识应用全球火红,也有越来越多应用在台湾落地,但也开始出现一些水土不服的情况。

10年前就投入刷脸研究的中华电信研究院,原本已经有了一套辨识度达99%的人脸辨识引擎,但是用的是100万张国外脸孔的资料,来进行模型训练,要在台湾用时,辨识效果并不高,后来,决定自行建置台湾自己的人脸数据库,仅增加了数千张的亚洲人脸,在实际测试时,人脸辨识率就有将近1成的提升,甚至比起原先用100万张人脸模型训练的表现更好,大幅修正了台湾人脸辨识的效果。

不只中华电信,就连今年3月在全球顶尖NIST人脸辨识大赛成绩名列前茅的讯连科技,也都深知在地人脸的重要性。即使技术上已经达到国际一流水准,但是为了改善原本亚洲国家人脸辨识度较低的情况,还在原本的千万人脸资料之外,另外增加包含台湾在内多达百万张的亚洲人脸,重新优化辨识模型,来开发出一个亚洲人专用版本,透过这个新版本,不只原先辨识率提升了0.9%,甚至更达到99.8%的超高辨识率,而且仅容许百万分之一的误判率。

资料量反而次要,应用场域的人脸资料才是关键

关键就在于应用场域不同,脸部辨识模型的辨识效果,就会有很大的不同。甚至可以说,资料量已经不是人脸辨识效果好不好的最主要因素,而是要用应用场域的人脸资料才是关键。因为只有从大量的现场拍摄的人脸资料,学习认得这个特定领域下的人脸特征,才有辨法符合特定应用所需的人脸辨识准确度与稳定度的要求。

尤其,在非约束的复杂环境下,想要让训练的识别模型能应付动态多人的人脸辨识,所要面对的技术挑战也更高。更需要有实际场域的人脸资料,因为,一般训练用的人脸样本,大多是在光线充足、不逆光环境下拍摄,而且多是正面照,相较之下,在实际的场域应用中,拍摄到的人脸照片常常会有视角差、光线不佳,也会受到周遭背景、拍摄的姿态角度、表情,以及人脸遮挡的影响(如头发、眼镜、头部饰品等)等多面向因素,都会影响到应用当下的人脸辨识正确率,也直接反应出这个人脸辨识产品技术力与稳定性。

人脸辨识不只要自己做,更得用台湾自己的人脸资料

尽管,人脸辨识技术发展,在深度学习加入之后,有了许多重大突破性技术,让它的辨识率可以大幅提高,甚至比人眼辨识还锐利,但在辨识一张人脸时,通常还是会经过人脸侦测、人脸校正、人脸特征值撷取共3个步骤。

对于每张人脸进行辨识前,需要先找到人脸的位置,然后通过脸部校正,再取出人脸特征来进行辨识。其中,特征抽取步骤最为关键,要产生最具有鉴别力的人脸特征,就必须要将大量人脸照片喂给多层的类神经网络,学习人脸主要特征,让它的辨识率尽量越高越好,而误判率则是越低越好。

在训练资料方面,现在免费好用的开源人脸数据库也不少,如MegaFace资料集包含百万张人脸图片,因为取得容易,而且资料量够庞大,常常被用来改进模型,让研究人员可以设计出更多层的神经网络架构,可以应用在需要更复杂判断的场域的人脸辨识上。

只不过,现在,这些公开的人脸数据库,很多都是以国外脸孔居多。尤其,许多数据库上的人脸资料,以欧美等白人国家的面孔占多数,也很直接反应在脸部辨识率,与误判率上的差异,只对西方国家人脸辨识特别好,对于亚洲、印度和非洲国家人脸辨识效果就没有那么好,也容易发生误判的情况。

以台湾脸孔来说,因为和西方国家人脸相比,台湾人脸轮廓较为扁平,在辨识台湾自己的人脸时,只要拍摄的脸部角度稍有偏差,就容易会被误认成别人或发生无法辨识的情况,如果换作是外国人就比较没这个问题。更有研究发现,不论是使用微软、或亚马逊AWS的人脸辨识云端服务,在测试亚洲脸孔时,辨识率也不如欧美人脸,甚至差距最大有6到8%之多。

就连在侦测如性别、年龄等不同人脸属性时也容易受影响。例如,麻省理工学院媒体实验室(MIT Media Lab)去年就曾测试不同家人脸辨识产品,发现除了白人比辨识黑人准确,辨识男性也比辨识女性较准确。这些产品不乏有知名人脸辨识大厂,如微软、IBM与中国旷视等。甚至,因为人脸资料分布的偏差(bias), 就连云端龙头亚马逊AWS自己也都闹出误认美议员为嫌犯的乌龙事件。

又以辨识人脸年龄为例,即使是同样20多岁的年轻人,欧美人脸看起来就是比亚州人脸更老,所以,用这些欧美资料训练出来的人脸模型,在辨识亚洲人的年纪时就会不太准,或是测出来的年纪会和外国人差异很大。

人脸辨识更是下一代个人化的身份认证机制

从技术应用需求来看,人脸辨识更是未来所有企业需要,甚至所有IT都会用到的一门AI基础技术。因为它就是下一代个人化的身份认证机制。以前,要登入台式电脑,得先输入一连串密码,现在更进一步用人脸确认身份,无需输入密码,使用者的脸就是通行密码。甚至未来更大应用会是零售业,可以经由扫描人脸,来提供个人化的广告服务,让门市或店家可以依据消费者的年龄、性别、表情特征,来提供量身定制的行销广告,或商品推荐。

但是想要让这个人脸辨识引擎,可以认得一张人脸更多细节,就必须要支援在地的人脸辨识技术,如此一来,训练出来的深度学习模型,辨识出来年龄的效果才会好。

如果用的都不是台湾在地的人脸辨识技术,只能使用欧美或中国的解决方案,台湾没有自己一套在地化人脸辨识引擎,就很难普及。

由于现在全球还没有一套人脸辨识引擎,可以适用所有人种、肤色,甚至不分应用场域都能用,这意谓著,即使用这个这场域资料训练完的人脸辨识引擎,也不见得在其他场域也能用得好,所以,台湾也需要自己的一套人脸辨识引擎。

对于企业来说,也只有自己做,才能设计出真正合乎自己应用需求的人脸辨识应用,来满足不同应用领域差异化的要求。

甚至针对每一个特定领域,未来都需要有这个场域吻合的训练资料集,才能够打造出贴近实际场域辨识需要的人脸应用。

台湾人脸辨识技术进展

 2004年   蒙恬科技推出国产第一套人脸辨识门禁系统      

 2013年   台湾桃园机场外国旅客通关查验导入浩鑫人脸辨识核心引擎

 2018年1月   群晖科技替网络NAS管理软件加入相簿人像自动标注、分类功能

 2018年9月   讯连科技发表结合深度学习技术的FaceMe脸部辨识引擎,准确率可达98.50% (百万分之一的误判率)

 2018年12月  中国信托展示国产人脸辨识ATM提款应用,异常提款也能认

 2019年4月   研勤科技推出考勤人脸辨识引擎,准确率达99.32%

 2019年5月   中华电信人脸辨识门禁系统正式推出上市,准确率达99.78%

 2019年5月   本土AI新创 SkyREC公开展示一次可侦测、辨识8千人脸的人脸辨识引擎

资料来源:iThome整理,2019年7月

2019-07-11 10:46:00

相关文章