APP下载

对抗疫情假新闻,英国新创打造COVID-19假讯息仪表板,用AI评分内容可靠度来呈现讯息错误程度

消息来源:baojiabao.com 作者: 发布时间:2024-05-17

报价宝综合消息对抗疫情假新闻,英国新创打造COVID-19假讯息仪表板,用AI评分内容可靠度来呈现讯息错误程度

Factmata过去专注于开发新闻内容分析技术,官网上提供的分析服务,可以让人将英文新闻的连结贴到该服务的搜寻字段,来自动分析该篇新闻中具有政治偏见、性别歧视等8种不当内容的可能性。

图片来源: 

图/取自Disinfo Cloud官网

全球、区域性武汉肺炎疫情分析的仪表板已经屡见不鲜,美国约翰霍普金斯大学在一月底就发布了全球确诊病例数仪表板,台湾疾管署官网也用疫情分析图表,来呈现台湾的确诊人数变化。不过,除了疫情分析仪表板之外,英国有家AI新创Factmata,三月中发起COVID-19假讯息仪表板专案,号招软件工程师、资料科学家共同投入仪表板的开发,来统计并追踪疫情期间泛滥的假新闻。虽然该仪表板尚未释出,但Factmata的首席执行官Dhruv Ghulati 5月底在Twitter表示,即将公开这个令人振奋的成果!

根据路透社新闻研究指出,光是1~3月武汉肺炎假新闻的查核数量就暴增9倍,趋势科技防诈达人也统计,台湾自疫情爆发以来,2月份所侦测到的假消息数量高达20万次,相较之前暴增2倍之多。这些数据一再凸显了有心人士在疫情期间操控、散播假讯息的问题,更有深受其害的国家如伊朗,因流传喝高浓度酒精能预防武汉肺炎的假讯息,已经有至少480人丧命。

为此,原先就运用NLP技术开发新闻内容分析引擎的Factmata,也投入开发疫情假讯息仪表板,来定期追踪与分析疫情相关的不实资讯。根据美国国务院所支持的打假技术审核平台Disinfo Cloud的介绍,Factmata即将释出的仪表板及其AI假新闻判读技术,每个月可审核超过五千万条内容,可检测的网络资料形态涵盖新闻网站、社交平台中的内容,也能追踪不实讯息的来源网站或散播者,同时凸显值得信任的资料来源。

在这个仪表板中,有一个叙述监控系统,能让分析人员追踪和群聚特定检索词范围内所有与武汉肺炎相关的叙述,Fatamata表示,这个技术有助于过滤掉与主题无关的内容,凸显有价值的叙述或意见,再拿来进一步分析。比如根据分析结果,“宠物可以感染并散布病毒”这个叙述,是5月1日~6日间散播速度最快的不实讯息。而针对这些关键意见或叙述,仪表板可以自动萃取出它的作者、立场、语言风格、来源和发布日期等相关讯息,以视觉化的分析图表来显示这些叙述随着时间的变化趋势。

针对这些关键叙述与内容,Factmata也开发了内容可靠性评分的技术,能够根据不同评分机制来过滤内容,这些评分机制包括:内容由机器人生成的可能性(bot score)、隐含政治偏见的程度(propaganda score)、受欢迎程度(popularity)、有趣却没被推荐的可能性(niche)、被广泛散播的可能性(threat score)等。

除了上述的评分机制,Factmata也开发了与疫情相关的医疗不实资讯算法,来找出威胁程度最高的叙述内容,借此确定优先处理的顺序。为了训练医疗不实资讯算法,Factmata已经建立了一个由10多个医疗小组组成的社群,以群众外包的方式来对错误讯息进行标记。这个模型透过专家注释、资料来源可信度、社交关系网络、与过去事实查核叙述的相似度等面向,来判断内容是否存在不实讯息,以及内容是否存在医疗不实资讯等。该判读技术能对长篇文章或短篇Twitter推文来审查。

Factmata开发的新闻内容辨识技术可提供台湾借镜

除了近日要发表COVID-19假讯息仪表板,Factmata过去专注于开发新闻内容分析技术,官网上提供的分析服务,可以让人将英文新闻的连结贴到该服务的搜寻字段,来自动分析该篇新闻中包含的政治偏见、性别歧视、耸动标题(Clickbait)、侮辱言论、猥亵言论、不敬言词(Toxicity)、种族歧视、威胁的程度,生成如该篇新闻有61%的可能性具有政治偏见、12%可能性具有耸动标题等建议,同时提供一个对于整篇新闻的评价分数,让用户自行判断是否要相信新闻中的内容资讯,或是否点击阅读。

资策会产业分析师张皓甯在一场研讨会中表示,Factmata的内容分析技术,并不是直接判读某篇新闻的真假,而是提供用户判读的参考依据,是可解释AI技术(XAI)的展现。她提到,现在的社群媒体已经很难靠一己之力来对抗假讯息,常需要仰赖与第三方合作来打击假讯息,但假讯息会因地域、语言、用户特性而有不同的呈现方式,因此,她建议,台湾有意投入AI假讯息辨识的业者,可以开发特定区域的影像、语音、影音辨识技术,来进行差异化开发,开发AI的同时,也可以运用XAI技术让假讯息的检核标准有所依据。

2020-06-04 12:14:00

相关文章