亚马逊 AWS 大规模宕机原因公布:自动化服务出现 Bug,导致网络过载

2021-12-12 19:12IT之家 - 汪淼

IT之家 12 月 12 日消息,12 月 7 日,亚马逊 AWS 云服务出现宕机,导致部分互联网服务离线数小时。

近日,亚马逊已经查明了本次宕机的原因,一项自动化过程导致了中断,该中断始于美国东部时间上午 10:30 左右。

据解释称,一项用于 AWS 主网络中的自动化容量扩展服务出现错误,触发了内部网络大量客户端的意外行为,这导致连接活动大量涌现,使内部网络和 AWS 主网络之间的网络设备不堪重负,并最终导致网络之间的通信延迟。

这个错误甚至影响了亚马逊修复该问题的能力,它阻止了运营团队使用实时监控系统和内部控制,不得不使用日志来查明发生了什么。亚马逊指出,服务启动直到美国东部时间下午 4:34 才开始改进,问题在美国东部时间下午 5:22 完全解决。

IT之家了解到,由于亚马逊的支持联络中心也在 AWS 网络上运行,因此客户在中断期间的七个小时内无法创建支持案例,亚马逊服务健康仪表板也受到影响。

亚马逊表示,它正在努力改进对中断的响应,并计划发布服务健康仪表板的改进版本,如果发生中断,应该可以帮助客户及时收到更新。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享