APP下载

脸书、IG、WhatsApp全球服务中断7小时,Cloudflare:可能是BGP惹的祸

消息来源:baojiabao.com 作者: 发布时间:2024-05-19

报价宝综合消息脸书、IG、WhatsApp全球服务中断7小时,Cloudflare:可能是BGP惹的祸
图片来源: 

photo by Greg Bulla on unsplash

从台北时间周二(10/5)凌晨12点20分左右,涵盖脸书、Instagram与WhatsApp等脸书家族的服务同时中断,且全球皆传出灾情,一直到早上7点多才逐步恢复正常。刚恢复平稳的脸书尚未公布肇事原因或是影响规模,Cloudflare则猜测,很可能是BGP惹的祸。

根据脸书今年第二季的财报,脸书家族的每日用户数为27.6亿,每月用户数则达35.1亿,显示全球有接近一半的人口至少使用了其中一项服务。

该平台的故障不仅影响一般的脸书用户,也影响了其它透过Facebook Login登入的应用。

此外,根据《纽约时报》的报导,这次的意外还波及到脸书内部的系统与工具,包含安全系统、内部行事历、调度工具及内部通讯平台Workplace;员工不仅无法以工作手机打电话,也不能接收来自外部的电子邮件;有些员工甚至因为他们的数位员工证也失效了,而无法进入办公大楼;另也派出一队员工到资料中心,打算重启服务器。

虽然脸书的反应很迅速,但似乎都无济于事,在当机发生的3个半小时之后,脸书技术长Mike Schroepfer透过Twitter表示,脸书遭遇了网络问题,团队正在努力除错与回复服务。

根据Facebook for Business今天早上9点更新的状态,脸书的广告管理工具与Graph API,皆仍处于故障的状态。

虽然脸书并未公布当机原因,不过CDN暨安全服务供应商Cloudflare说话了,当他们查询脸书DNS却发现“服务失败”(SERVFAIL)的回应时,原本以为是自己的DNS解析器1.1.1.1出错了,正要张贴公告时,才知道不只是脸书,连WhatsApp与Instagram都当机了,它们的DNS名称都停止解析,基础架构的IP亦无法存取,仿佛像是有人把资料中心的所有线都拔掉了,使得它们同时从网络上消失。

Cloudflare认为,造成Facebook、Instagram与WhatsApp同时消失最有可能的因素是BGP。

BGP的全名为边界闸道协定(Border Gateway Protocol),是全球网络自治系统(Autonomous System)之间用来交换路径资讯的机制,这些让网络得以运作的大型路由器不断更新所有可能的路径列表,以将每一个网络封包传送到最终目的,少了BGP,路由器便不知自己该做什么,全球网络亦无法运作。

Cloudflare说明,全球网络其实是由不同网络组成的一个大型网络,BGP扮演绑定它们的角色,它允许一个网络(如Facebook)向其它网络宣告自己的存在,在此次的事件中,Facebook并未宣告自己的存在,使得不论是ISP业者或其它网络都无法发现Facebook,因而无法存取。

每个AS会有自己的号码(ASN),也会有统一的内部路由政策,AS可以产生前缀(控制一组IP地址),也能传输前缀(如何存取特定的IP群),每一个ASN都必须透过BGP向全球网络宣告自己的前缀路由,否则其它人就无法发现或连结。

但今天凌晨Cloudflare却注意到Facebook不再发布其DNS前缀的路由,这至少代表Facebook的DNS服务器停摆了,也让1.1.1.1 DNS解析器无法再回应针对Facebook或Instagram的IP地址查询。而且不只是1.1.1.1,Google的8.8.8.8或其它的公共DNS也都找不到Facebook、Instagram与WhatsApp。

其实Cloudflare在脸书家族当机的五个多小时之后,就重新在1.1.1.1上看到Facebook了,但要回到全球网络还需要多一点时间。

2021-10-05 12:52:00

相关文章