2023年不但经济不景气,就连一年一度的双11都崩盘了!
就在11月12日晚间,“阿里云盘崩了”“淘宝又崩了”“闲鱼崩了”“钉钉崩了”等话题相继登上热搜,阿里云全线产品受到影响。还有网友吐槽,就连充电桩和学校里的洗衣机、饮水机机器都"崩"了。
前不久的10月末的语雀崩溃的余热还没散去,现在又在双11期间发生如此大规模的崩溃事件,看来阿里程序员今年的年终奖怕是也要崩溃喽!
01事件经过
12日傍晚开始,有网友反映,阿里全系产品崩了,阿里云多个相关服务均出现了问题,包括淘宝、饿了么、夸克等。据网友反映,阿里云盘疑似出现服务器故障,目前手机端和电脑端均无法登录。淘宝、天猫等电商平台也打不开商品页面;钉钉和语雀等办公软件无法使用;支付宝小程序也出现登录失败。
据悉,此次波及范围亦比较广,受影响地域包括:华北2 (北京)、华北6 (乌兰察布)、 华北1 (青岛)、华东2(上海)、华南2(河源)、华北3(张家口)、中国香港、印度(孟买)、美国(硅谷)、华南1(深圳)、英国(伦敦)、韩国(首尔)、日本(东京)、阿联酋(迪拜)、西南1 (成都)、华南3 (广州)、新加坡、澳大利亚 (悉尼)、马来西亚(吉隆坡)、 华北5 (呼和浩特)、 印度 尼西亚(雅加达)、美国 (弗吉尼亚)、菲律宾 (马尼拉)、泰国(曼谷)、华东1(杭州)、华南1金融云等。
此外,据数据显示,阿里云的企业用户超过300万家,这些客户因阿里云的云服务不可用,线上业务运营也可能面临全线崩溃的局面,看来云服务可以是“银弹”,也可能是“炸、弹”。
12日18时许,阿里云发布公告称,阿里云云产品控制台服务异常。从北京时间2023年11月12日17:44起,阿里云监控发现云产品控制台访问及API调用出现异常,阿里云工程师正在紧急介入排查。经过工程师的处理,通过分批重启组件服务,绝大部分地域控制台服务已恢复访问。19:20左右,阿里旗下的淘宝、钉钉、阿里云盘等APP已全面恢复。
笔者打开阿里云的健康状态面板,可以看到12日,处于异常状态的服务高达92个,可见这次事件的影响范围之广、危害之大!
02反思
这并不是阿里云首次出现大面积故障,早在2022年12月18日,阿里云香港域的可用区C就曾发生过大规模服务中断事件,对很多客户业务产生重大影响,影响面甚至扩大到香港可用区C的EBS、OSS、RDS等更多云服务。之后,阿里云发布了事件称,因冷机系统故障恢复时间过长、现场处置不及时导致触发消防喷淋、客户在香港地域新购ECS等管控操作失败、故障信息发布不够及时透明是导致此次宕机时间长、规模大的四大重要原因。
阿里云这次出问题,确实让我们对云服务有了新的认识。使用单一的云服务供应商就像把所有的鸡蛋放在了一个篮子里,要是出了问题,那可就是大问题。所以,现在越来越多的企业开始考虑,是不是应该多找几个篮子,以防一个篮子破了,其他篮子还能顶上。
另外,现在的云服务提供商可真的要提供高可靠性的服务了,不能只顾着自己跑马圈地忽悠企业上云,却不能提供相应的可靠性保障,毕竟企业可不想因为一个单点故障就影响到整个业务。所以啊,选择一个具有高可用性和容错能力的云服务也是非常重要的。
总之啊,这次阿里云大规模故障让我们认识到云服务虽然好,但也不能忽视其中的风险。企业要想更好地保障业务运行,就要更加注重这些问题。
原创不易,如果觉得此文对你有帮助,不妨点赞+收藏+关注,你的鼓励是我持续创作的动力!

文章评论