【发现问题】 1、登陆SCP后台发现原集群内一台服务器报磁盘依次拔出的告警;
2、单独登陆集群也有相同的告警,而那个时间点也确定无疑没有进出机房的人员做相关操作。 【影响及范围】 未发现影响业务,使用正常 【处理过程】 1、开始以为是误报也并没有影响正常业务,后经研发等技术人员深入分析后初步判定为raid卡问题导致,厂家为复现问题决定返厂并更换新的主机,点个赞! 2、很快新增的主机和替换的主机都到了,先将需要替换的上架升级到最新版本配置好后,【实体机】--【物理主机】--【添加主机】; 3、按照选择物理主机--配置网络--替换主机硬盘完成配置; 4、根据大小等待。。。后完成替换; 5、将替换下的主机清理数据,【系统管理】--【系统配置备份与恢复】--【归还测试设备】; 5、打包邮回,后续会跟踪了解具体原因。 7、上架新增的服务器重新授权SCP,配置好后加入到新集群中去,此过程忽略。PS:前面面板加了一个小锁,有心了,设计风格有点像某为。 更换的服务器面板logo灯旁也加了大大的sangfor 8、全部弄好后一键检测后没有问题,就可以体验新功能了。 |