APP下载

魔高一丈!脸书举办Deepfake造假影片辨真大赛找解方,全球2千AI专家参赛最高仍只认出8成

消息来源:baojiabao.com 作者: 发布时间:2024-06-14

报价宝综合消息魔高一丈!脸书举办Deepfake造假影片辨真大赛找解方,全球2千AI专家参赛最高仍只认出8成

Deepfake影片辨识示意图,图片来源/脸书

脸书上周五(6/12)日公布Deepfake影片辨识技术创新大赛成果,显示虽然参赛模型的辨识技术准确度还不错,但用在全自动化人脸辨识作业则仍有待努力。

由于AI技术演进日新月异,各界担心AI制造出的Deepfake影片煽动种族仇恨或打击政敌。去年9月间脸书、微软发起Deepfake 影片辨识技术挑战赛(Deepfakes Detection Challenge)以期能号召天下好手一起来贡献、改进辨识出这类AI假影片的算法。

为了这个大赛,脸书聘请了超过3,500名演员,花了一个多月时间录制一段谈话影片,其中一部分影片以AI移花接木,接上别的演员的脸来造假,此外还集结网络上合法取得、总数超过10万则影片。这些真、假混合的影片作为训练和测试参赛模型的资料集。但参赛者的模型还必须拿来侦测10万则“black box”资料集,即他们之前完全没有接触过的影片,目的是评估模型真枪实弹的辨识能力。公开和black box资料集各会根据测试产出排名。

活动从12月开始,一共吸引了2,114名参赛者上传超过3.5万个模型。评审团队则集结脸书、微软、康乃尔、牛津、马里兰、加州大学柏克莱分校、纽约市立大学阿巴尼分校、麻省理工学院、慕尼黑科技大学及拿坡里费德里克二世大学(University of Naples Federico II)的专家。

脸书指出,在公开资料集的测试结果方面,表现最好、由白俄罗斯机器学习专家Selim Seferbekov上传的模型达到82.56%的平均精准度,平均精准度是电脑视觉任务的衡量指标。但如果用来测试“black box”资料集时,平均精准度就只剩下65.18%,落到第4名。但另一方面,在black box资料测试组排2到5名的模型,在公开资料组排名却也很低(分别为37、6、10、17名)。大会同时表示,65.18%也成为AI测试的基准线。

脸书指出,deepfake侦测一直有个尚未解决的问题,即用已知资料训练而成的模型难以推论到未知资料上。而在本次比赛中,已知、未知资料集成绩不一致的结果,再次反映侦测模型难以推论的难题,也是未来必须再努力的地方。

而主办单位也从最好的模型作品中归纳出三大特点。第一是许多使用了很聪明的资料增强(augmentation)法,如随机或使用地标、注意力(attention)网络去除部分脸部特征,另一些人则使用更复杂的混合式增强或WS-DAN(Weakly Supervised Data Augmentation Network)模型,显示大家偏好以细腻的视觉分类法来判断脸部改造的痕迹。第二是所有优胜模型都使用预先训练的EfficientNet网络为基础,大部分使用EfficientNet的B7变型,显示广受欢迎的整合学习(ensemble learning)式模型,也适合用在deepfake影片辨识上。最后,优胜队伍没有一个使用数位鉴识技术,如分析影像制作过程产生的感测器噪音指纹或其他特征,显示影片像素层次上使用未学习过的分析技术,不是不好用,就是还不普及。

脸书也会在本周的电脑视觉与样式辨识(Computer Vision and Pattern Recognition,CVPR)大会上宣布,将原始资料集全部开放给更多研究人员,以促进侦测技术的进展。

2020-06-15 17:50:00

相关文章