本帖最后由 全活不打折 于 2025-5-19 12:16 编辑
问题背景:
在给某客户升级超融合版本后,超融合平台告警主机<x.x.x.x>的RAID卡状态异常,错误详情:RAID卡控制器异常,如果持续报错,请联系供应商进行技术支持。 本次版本升级跨度不大,从690升级到最新的610R2版本,升级前巡检工具检测一切符合升级条件。
问题排查过程: 研发后台排查告警原因是HCI系统读取到RAID状态的返回值是一个乱码
正常情况应该是有一个OK的返回值,并且巡检工具的巡检报告中能看到对应RAID卷状态与成员磁盘的信息 这是巡检报告中异常的主机的RAID状态:
问题原因: 最后400查询RAID兼容性列表,发现问题是此型号RAID卡不兼容630以后的高版本:
总结:
出现问题的原因是巡检工具对集群进行升级前检测是没有RAID卡硬件对高版本的兼容情况,所以兄弟们升级第三方服务器的HCI产品,建议先自己查询一下服务器硬件对高版本的支持情况,避免升级后主机宕机不能回退的情况出现,特别是客户的重大业务集群,升级前多做一下升级前准备工作,升级后就能少一些麻烦和风险。 |