服务器宕机,运维如何才能不坐以待毙?
前段时间,大规模的云服务器宕机故障占领了热搜与程序员们的朋友圈,一大拨程序员、运维专员都从睡梦中被叫醒跑去办公室干活。除了加班的程序员们,其他受到影响的各种应用使用者们也是一头雾水。有网友称,疑似阿里云华北2部分机器故障,怀疑是磁盘问题,部分硬盘无法访问,凡是会读写故障盘的系统软件或服务程序,都会收到影响。华北2地域可用区C部分ECS服务器等实例出现IO HANG,经紧急排查处理后逐步恢复。目前我们已经全面排查其他地域及可用区,未发现此类情况。专家认为,运维团队的实力也是云计算服务商的核心竞争力,云计算要求更高的运维能力,能够保障大规模基础设施和业务稳定运行。