APP下载

人脸辨识对女性、深色人种辨识较差,微软与IBM着手改进

消息来源:baojiabao.com 作者: 发布时间:2024-05-21

报价宝综合消息人脸辨识对女性、深色人种辨识较差,微软与IBM着手改进
图片来源: 

微软

麻省理工学院媒体实验室(MIT Media Lab)的研究人员Joy Buolamwini今年初曾公开批评,人脸辨识技术可能因为所使用的资料集及建立算法的条件而造成偏差,例如辨识男性比辨识女性准确,辨识白人又比辨识黑人准确,而微软与IBM则不约而同地在本周祭出改善人脸辨识偏差的措施。

MIT媒体实验室测试了来自微软、IBM与中国旷视(Megvii)的人脸辨识系统,却发现这些系统辨识浅色人种性别的能力大过于辨识深色人种的性别,而辨识度最差的则是深色人种的女性。

其中,微软在周二(6/26)宣布已更新该公司的人脸辨识技术,大幅强化系统辨识基于各种肤色之性别的能力。

微软数位顾问服务技术长John Roach认为,在辨识深色皮肤的女性上有较高的错误率突显了整个产业的挑战—人工智能技术只能跟用来训练它们的资料一样好,假使人脸辨识系统要对所有人类一视同仁,那么所用来训练的资料集就应该要能代表各式各样的肤色、发型、珠宝或眼镜。

于是微软与专家合作以企图解决偏差及公平的问题,改善了性别分类系统,以让所有肤色在性别辨识上都能有更好的结果,现在的新系统在辨识深色皮肤性别的错误率降低了20倍。

另一方面,IBM也同意人脸辨识的偏差来自于训练系统缺乏不同的数据,因此决定在今年秋天公开释出释出两个资料集供科技产业与研究社群使用。

其中一个是含有100万张影像的人脸属性与身份训练资料集,它会同时被标注属性与身份,利用Flickr影像的地理标签来平衡来自不同国家的数据,还有主动学习工具以减少样本选择的偏差。目前全球最大的人脸属性资料集只含有20万张影像,且只单独供应属性或是身份,IBM的新数据集除了资料量更为庞大之外,还能将属性与个人配对。

另一个资料集则包含了3.6万张的人脸影像,且均匀分配在不同的种族、性别与年龄,此一多元化的资料集将可供人们评估自己的技术,或是协助算法的设计者辨识及解决其人脸辨识系统上的偏差。

2018-06-28 19:31:00

相关文章