【干货满满】超融合raid卡异常问题处理
  

魏溢森 64001人觉得有帮助

{{ttag.title}}
今日与诸位分享最近处理的超融合raid告警的问题
话不多说上图


问题描述
近日客户反馈超融合出现raid卡告警问题,需要上门排查
可以看到磁盘1有提示 Predictive Failure 告警


问题排查
1、报错信息分析
既然我们已经看到问题现象,那我们去百度搜索一下这个是什么意思
发现是个预期性告警,应该是有块磁盘马上快要出现问题了
2、进到服务器IPMI后台界面查看硬件状态
硬盘状态中第一块磁盘已经不是online(在线)状态了
看来是系统盘出现问题导致raid出现问题。

问题处理
与客户沟通后联系硬件厂商进行系统盘替换
因系统盘组建Raid1,所以替换的话 可以直接热插拔期间不影响虚拟机使用,磁盘之间会自行同步数据。


处理结果验证
发现还是存在raid卡告警
询问过后发现只需要在亚健康主机列表中移除出来,然后将告警信息确认后告警就可以清除了。
后台查看raid卡状态已经正常,只需要把残留的告警清除就不会在告警了,这个报错一般半小时报一次。
当天观察3小时后正常,看来确实是系统盘的问题导致raid控制器报错。

打赏鼓励作者,期待更多好文!

打赏
4人已打赏

头像被屏蔽
新手780102 发表于 2024-8-19 09:18
  
提示: 作者被禁止或删除 内容自动屏蔽
新手626351 发表于 2023-12-3 17:55
  
谢谢楼主分享,学习了。。。。
新手378833 发表于 2023-11-29 12:04
  
这个方式不错,下次可以试试
新手626351 发表于 2023-11-29 08:47
  
感谢分享有助于工资和学习!
新手378833 发表于 2023-10-19 10:15
  
有助于学习!!!!!!!!!!
哇哈哈哈哈哈 发表于 2023-10-18 16:57
  
感谢楼主分享,学习一下
新手626351 发表于 2023-10-12 09:19
  
每天学习一点点,每天进步一点点。
傲世ღ万物 发表于 2023-9-20 16:34
  
每天学习一点点,每天进步一点点。
新手620211 发表于 2023-8-21 22:42
  
不够智能,要手动清除报警信息!
发表新帖
热门标签
全部标签>
新版本体验
每日一问
纪元平台
社区新周刊
安全效果
GIF动图学习
产品连连看
功能体验
标准化排查
高手请过招
【 社区to talk】
信服课堂视频
安装部署配置
测试报告
SDP百科
终端接入
平台使用
每周精选
畅聊IT
答题自测
专家问答
技术笔记
技术圆桌
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
日志审计
问题分析处理
流量管理
每日一记
运维工具
用户认证
原创分享
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
排障笔记本
产品预警公告
玩转零信任
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
2023技术争霸赛专题
卧龙计划
华北区拉练
天逸直播
以战代练
秒懂零信任
技术晨报
技术盲盒
山东区技术晨报
文档捉虫
齐鲁TV
华北区交付直播
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记
排障那些事
西北区每日一问
升级&主动服务
高频问题集锦
POC测试案例
全能先锋系列
云化安全能力
专家说
热门活动
产品动态
行业实践
产品解析
关键解决方案

本版版主

193
359
1005

发帖

粉丝

关注

11
6
1

发帖

粉丝

关注

本版达人

皮皮虾·真

本周建议达人

郑州网络

本周分享达人

二进制网络

本周提问达人