APP下载

【直击Web科技最前线:马里兰大学电脑科学系教授Jen Golbeck】社群平台假账号泛滥,40年老方法也能揪出灌水机器人

消息来源:baojiabao.com 作者: 发布时间:2024-05-19

报价宝综合消息【直击Web科技最前线:马里兰大学电脑科学系教授Jen Golbeck】社群平台假账号泛滥,40年老方法也能揪出灌水机器人

马里兰大学电脑科学系教授Jen Golbeck解释,按照班佛定律(Benford\'s Law),以1为首位数字的出现概率,约30%,随着数字越大,出现的概率则越小。这个方法,能有效在社群媒体上,揪出专门灌水赞数或转推文章的假账号机器人。(图片来源/Jen Golbeck)

网络技术带动社群媒体发展,让大众更快速与亲友分享生活点滴,甚至用来打造个人品牌。但社群媒体的兴盛,却也产生假账号买卖,专门替特定账号冲赞数,或是投票灌水、分享特定贴文等。美国马里兰大学电脑科学系教授Jen Golbeck在今年大会中,分享自己如何以40年前的老方法,来揪出脸书、Twitter上的冲赞机器人。

Jen Golbeck指出,冲赞数的假账号机器人因使用者需求而存在,赞数多,就越能放大自己的影响力。就市场行情来说,美金1元就能买到50至100个赞,便宜的价格更导致假账号的猖獗。

也因此,各大社群平台利用不同方法,来打击假账号。比如根据使用者特征、好友数、活动时间、贴文内容和语句情感等特征,训练一套系统,来自动判断账号真伪。

采用40年班佛定律,从好友数、追踪人数看出端倪

但Jen Golbeck认为:“还有一个更简单的方法,能找出假账号,”也就是班佛定律(Benford\'s Law)。班佛定律40年前兴起,是指在日常生活的数据中,数字1到9出现的概率,以1最大,且随着数字增长,出现概率递减。

举例来说,以1为首位数字的出现概率,约为30%,以9为首位数字的概率,则是4.6%。

于是,Jen Golbeck利用这个方法,从Twitter、脸书、Pinterest、Google Plus和LiveJournal等社群平台中,找出账号好友数和追踪人数等数值分布,来核对是否符合班佛定律。

自掏腰包买转推数,从中揪出俄罗斯假账号军团

为衡量班佛定律的符合程度,她采用卡方检验(Chi-square test)来检测P值;如果P值小于0.05,就表示不符合班佛定律。

为展开研究,她自掏腰包,购买脸书和Twitter的赞数与转推数,来转推或按赞自己的贴文。她解释,她先利用新设的账号,发出无意义的贴文,比如只有一个数字,然后用买来的服务,来转推或按赞这些贴文。

接着,她观察,这些转推或按赞的贴文中,有哪些陌生账号也转推或按赞。然后,她再分析这些陌生账号及其追踪者,来确认真伪。

在研究中,Jen Golbeck处理了数万个账号,“不出所料,几乎所有账号都符合班佛定律,只有100多个有问题。”

于是,她深入调查这100多个账号,发现“除了1个是真人外,其余都是一模一样的俄罗斯机器人假账号。”这些账号随机推文,内容不是从操作手册节录的句子,就是小说段落,“显然由同一个算法来控制。”

随着进一步的调查,Jen Golbeck也发现,这些机器人,是一支俄罗斯假账号军团的一部分。她也在后来的几年间,观察这些机器人的行为。惊讶的是,这些行为模型并未改变。

“也许,这些机器人长期进行这些随机、模拟人类的行为,是要让自己的存在更合理,不被纠察系统抓到。”她推测,等到时机成熟时,其中几个机器人账号,也许会进行灌水、冲赞等行为。

而最好的解法,莫过于找出机器难以控制的行为特征,来辨识账号真实身份。

2020-05-07 09:55:00

相关文章