亚马逊披露全球宕机原因:单点竞争错误引发连锁故障
亚马逊公司披露,近期导致全球多项云服务中断的 AWS 宕机事件由 DynamoDB 系统中的软件缺陷引发。问题源于 DNS 管理模块的竞争条件,使两个并行组件在高负载下互相冲突,最终导致数据库崩溃。
故障最早发生在美国东部数据中心,进而影响 EC2、Redshift、Lambda 等主要服务。亚马逊表示,已暂停相关自动化机制并着手修复漏洞,以防止类似事故重演。
Ars Technica
🍀在花频道 🍵茶馆 📮投稿
亚马逊公司披露,近期导致全球多项云服务中断的 AWS 宕机事件由 DynamoDB 系统中的软件缺陷引发。问题源于 DNS 管理模块的竞争条件,使两个并行组件在高负载下互相冲突,最终导致数据库崩溃。
故障最早发生在美国东部数据中心,进而影响 EC2、Redshift、Lambda 等主要服务。亚马逊表示,已暂停相关自动化机制并着手修复漏洞,以防止类似事故重演。
Ars Technica
🍀在花频道 🍵茶馆 📮投稿
😁 134 ❤️ 7 👍 4 👎 2 👀 2 🔥 1 👏 1