2021年10月4日Facebook史上最严重宕机复盘分析

专注IP定位 等级 590 0 0
标签: 脸书

1、相关新闻

据BBC等媒体报道,UTC时间2021年10月4日15时39分(即北京时间10月4日23时39分),社交网络Facebook及其子公司Messenger、Instagram和WhatsApp全球无法使用长达7个小时。

Facebook在其twitter中发表官方声明“Our engineering teams have learned that configuration changes on the backbone routers that coordinate network traffic between our data centers caused issues that interrupted this communication. This disruption to network traffic had a cascading effect on the way our data centers communicate, bringing our services to a halt” (翻译:调度数据中心之间流量的骨干网路由器配置变化造成了这次通讯中断。这种网络流量中断对数据中心的通信产生了连锁效应,最终导致我们服务宕机。)

可以看出官方的答复并没有很清楚地说明错误原因。因此我们复盘给出宕机事故的根本原因。

2、Downdetector监测到Facebook网络波动 2021年10月4日Facebook史上最严重宕机复盘分析

图1 Downdetector监测到Facebook网络波动 Downdetector网站通过收集社交网络中的中断信息来推断断网,如图1所示。Downdetector在EDT时间的10月4日11时44分(即北京时间10月4日23时44分)检测到Facebook网络波动问题,具体原因没有说明。

3、Facebook和WhatsApp服务中断原因分析 Facebook的AS为AS32934,WhatsApp的AS为AS11917。

北京时间10月5日凌晨0时(UTC时间10月4日16时整)观察到Facebook(AS32934)出现网络波动,其Prefix数量和IP数量都有所减少。直到北京时间10月5日早上7时整,Prefix数量和IP数量恢复,如图2所示。其中,Prefix数量由10月4日23时30分的129个减少为10月5日0时的103个,Prefix数量减少了26个,共计5,888个IP。丢失IP块明细如下:

129.134.25.0/24、129.134.26.0/24、129.134.27.0/24、129.134.28.0/24、129.134.29.0/24、129.134.30.0/23、129.134.30.0/24、129.134.31.0/24、129.134.65.0/24、129.134.66.0/24、129.134.67.0/24、129.134.68.0/24、129.134.69.0/24、129.134.70.0/24、129.134.71.0/24、129.134.72.0/24、129.134.73.0/24、129.134.74.0/24、129.134.75.0/24、129.134.76.0/24、129.134.79.0/24、157.240.207.0/24、185.89.218.0/23、185.89.218.0/24、185.89.219.0/24、69.171.250.0/24

2021年10月4日Facebook史上最严重宕机复盘分析

图2 网动仪捕获到Facebook(AS32934)有明显波动情况发生

Facebook有4个权威DNS服务器,分别是a.ns.facebook.com(129.134.30.12)、b.ns.facebook.com(129.134.31.12)、c.ns.facebook.com(185.89.218.12)和d.ns.facebook.com(185.89.219.12),4个DNS服务器IP都在丢失的IP块中。

因此,这次故障的原因是调度数据中心之间网络流量的骨干路由器配置更改导致边界网关协议撤销了Facebook自治域AS32934下包含Facebook域名服务器IP的IP地址块,抹去了Facebook需要的DNS路由信息,紧接着DNS服务器离线,用户无法解析Facebook和相关域名并访问服务。

同时,在北京时间10月5日凌晨0时开始也监控到了WhatsApp(AS11917)下所有Prefix、IP和路径的丢失,如图3所示。

2021年10月4日Facebook史上最严重宕机复盘分析

图3 网动仪捕获到WhatsApp (AS11917)有明显波动情况发生

WhatsApp服务也无法访问的原因是:在2019年Facebook 合并旗下所有服务并实现集中化,使公司可以统一了解用户的互联网使用习惯。但是,这也使得本次单点故障影响了整个Facebook服务体系。

综上所述,埃文科技网动仪捕获到Facebook的AS32934和WhatsApp的AS11917的网络波动,波动时间也与新闻报道的Facebook断网时间吻合。服务中断原因是主干路由器上的配置更改导致边界网关协议(BGP) 撤销了托管Facebook域名服务器的IP地址前缀,进而引发的一系列服务异常。

收藏
评论区

相关推荐

TS核心知识点总结及项目实战案例分析
前言 最近工作一直很忙,复盘周期也有所拉长,不过还是会坚持每周复盘。今天笔者将复盘一下typescript在前端项目中的应用,至于为什么要学习typescript,我想大家也不言自明,目前主流框架vue和react以及相关生态的内部构建大部分都采用了typescript,其原因就在于它的静态类型检查极大的提高了代码的可读性和可维护性,而且定位问题非常方便。下
后台更新数据方案
当你遇到一些让你大吃一惊的解决方案的时候你不要惊讶,要学会低头去面试它,解决它。最近公司项目要做个人脸识别,类似于门禁卡之类的。本来这也没什么,因为我接到任务后第一反应是这样的逻辑:设备采集图片 设备识别图片是否是人脸 是人脸 提交服务器进行身份识别 服务器返回人物身份信息我觉得这样的逻辑就是有点耗时。然后根据公司需求是要做百度人脸的
React 之设计原则
编写该文档的目的是,使开发者更易于了解我们如何决策 React(应该做哪些,不应该做哪些),以及我们的开发理念。我们非常欢迎来自社区的贡献,但如若违背这些理念,实非我们所愿。 注意: 文章描述了 React 自身的设计原则,而非 React 组件或应用,阅读者需要对 React 有深入的理解。 如需 React 的入门文档,查看 。
NDK开发前奏 - 实现支付宝人脸识别功能
1. 基于 Android Studio 的 opencv 配置与使用先推荐一本书 《计算机视觉 算法与应用》,相信用过 OpenCV 的哥们都知道这是用来干啥的,这里我就不再啰嗦。只说一下他的应用领域:人机互动、物体识别、图像分割、人脸识别、动作识别、运动跟踪、机器人、运动分析、机器视觉、结构分析、汽车安全驾驶等等。这次我们主要用它来做人脸识别,注意人脸
2021年10月4日Facebook史上最严重宕机复盘分析
1、相关新闻据BBC等媒体报道,UTC时间2021年10月4日15时39分(即北京时间10月4日23时39分),社交网络Facebook及其子公司Messenger、Instagram和WhatsApp全球无法使用长达7个小时。Facebook在其twitter中发表官方声明“Our engineering teams have learned that c
C盘的用户文件夹转移到其他分区
最近系统坏了,也不知道什么原因, 没细找, 就直接解压windows文件夹复原了, 什么也没丢, 挺方便的, 这里就分享给大家把, 以后系统坏了,也不怕丢东西了. C盘中除了windows,其他都可以挪到其他盘的,比如D盘, 说下操作: 用大白菜PE进入系统, 调整盘符顺序, 正常你的电脑应该的C盘,D盘,E盘这样的,但进入PE盘符可能和你电脑就不一
Celery 和 Redis 入门
**Celery** 是一个广泛应用于网络应用程序的任务处理系统。 它可以在以下情况下使用: **在请求响应周期中做网络调用**。服务器应当立即响应任何网络请求。如果在请求响应周期内需要进行网络调用,则应在周期外完成调用。例如当用户在网站上注册时,需要发送激活邮件。发送邮件是一种网络调用,耗时2到3秒。用户应该无需等待这2到3秒。因此,发送激活邮件应当在
Android 超简单集成活体检测技术 快速识别“假脸”
### Android 超简单集成活体检测技术 快速识别“假脸” 前言 == 你有没有过这样的顾虑,刷脸解锁真的安全吗?如果有人用我的照片或者视频冒充我,那么手机可不可以发现镜头前不是我本人呢?当然可以啦。华为HMS ML Kit活体检测技术可以准确地分辨真实人脸和“假脸”。不管是人脸翻拍照片、人脸视频重放,还是人脸面具,活体检测技术都可以马上揭穿这些“
Apache Cassandra 在 Facebook 的应用
谁说 Facebook 弃用 Cassandra?相反 Facebook 拥有全世界最大的单个 Cassandra 集群部署,而且他们对 Cassandra 做了很多性能优化,包括 Cassandra on RocksDB 以提升 Cassandra 的响应时间。 在 Instagram (Instagram是Facebook公司旗下一款免费提供在线图片及
C#实现基于ffmpeg加虹软的人脸识别
关于人脸识别 目前的人脸识别已经相对成熟,有各种收费免费的商业方案和开源方案,其中OpenCV很早就支持了人脸识别,在我选择人脸 识别开发库时,也横向对比了三种库,包括在线识别的百度、开源的OpenCV和商业库虹软(中小型规模免费)。 百度的人脸识别,才上线不久,文档不太完善,之前联系百度,官方也给了我基于Android的Example,但是不太符合我
EXIN DevOps Master培训有感
![](https://oscimg.oschina.net/oscnet/1a39fc11-ac00-417f-8c0f-2565a1a49f9a.png) 这几天有幸参加了高维社区组织的EXIN DevOps Master国际认证课程,有理论学习,有沙盘模拟,还有真实的考试,可谓紧张而充实,接触到的一些经验和理论,还是值得在实际工作中,借鉴以及
GitHub 热榜:天才黑客开源新项目,不到 1000 行代码,1400 Star!
△点击上方“Python猫”关注 ,回复“ **1** ”领取电子书 ![](https://oscimg.oschina.net/oscnet/66bff4e5-910b-4d44-847f-be80bf0e7552.png) 来自机器之心 在深度学习时代,谷歌、Facebook、百度等科技巨头开源了多款框架来帮助开发者更轻松地学习、构建和
HAAR与DLib的实时人脸检测之对比
人脸检测方法有许多,比如opencv自带的人脸Haar特征分类器和dlib人脸检测方法等。 对于opencv的人脸检测方法,优点是简单,快速;存在的问题是人脸检测效果不好。正面/垂直/光线较好的人脸,该方法可以检测出来,而侧面/歪斜/光线不好的人脸,无法检测。因此,该方法不适合现场应用。而对于dlib人脸检测方法采用64个特征点检测,效果会好于opencv
PlaidCTF2020 Mooz Chat 复盘
**前言** Part 1 (150 pts) —7 solves pasten A0E Tea Deliverers Part 2 (400 pts) — 1 solves pasten Part 1: Tom Nook and Isabelle have been exchanging text messages over Mooz recentl
Python骚操作:利用Python获取摄像头并实时控制人脸!
实现流程 ---- > 从摄像头获取视频流,并转换为一帧一帧的图像,然后将图像信息传递给opencv这个工具库处理,返回灰度图像(就像你使用本地静态图片一样) > 程序启动后,根据监听器信息,使用一个while循环,不断的加载视频图像,然后返回给opencv工具呈现图像信息。 > 创建一个键盘事件监听,按下"d"键,则开始执行面部匹配,并进行面具加