本帖最后由 韩立春 于 2024-3-12 15:31 编辑
超融合底层进系统后满屏报EXT3-fs error 错误的解决方法
最近,有一学校客户组建的3台Lenovo X3650M5 超融合服务器,超融合版本是SANGFOR aCloud 5.8.3 Build20180301,系统使用有6年了,版本相对较老,有一天在巡检过程中发现其中有一台服务器在WEB界面里显示是断开的情况,由于学校总会有断电的现象,所以也没在乎,在接KVM的情况下看到服务器底层系统满屏报journal commit I/O error 、EXT3-fs error的错误,重启后在20分钟左右web界面是在线的状态,但过20分钟后又是满屏跑journal commit I/O error 、EXT3-fs error的错误。 这是什么情况,是系统坏了,还是什么情况,于是打400让400小哥哥帮参考一下是什么情况。400看到我发的报错信息说是硬盘坏了。然后又问我进服务器后台看看有没有什么报错,我说目前服务器没有任何报错。 整体健康状态没有问题。 RAID 硬盘配置信息
RAID硬盘信息
RAID 日志信息
服务器后台日志信息 解决办法: 最后400说是系统盘坏了,让我准备一下480GSSD的系统盘,但我还是不太相信是硬盘坏了,因为它能进底层系统,如果不能进底层系统有可能是硬盘坏了,以前在联想干过,感觉是raid卡也有问题,因为Lenovo x3650m5 raid卡坏了有可能是不报错的。也与朋友校验了一下。于是果断在行里采购了一个RAID 5210的raid卡和一块SSD硬盘,当然是事先说明什么坏了换什么,先暂时借用一下。 待到硬件都到了,我拿着硬件去了客户那,我合计先换RAID卡,代价是最小的,于是我换了RAID卡。
换完RAID卡后,我把服务器开开了,进入了底层系统,于是我开始观察前20分是否还底层系统报错,但等了6个小时都没事,还是没有事。最后断定是RAID的事。
各位亲们!如果有不周到的地方,请大家多多指教。也感谢大家的鼓励!!动动你的小手,帮多多打赏,点赞,留下宝贵的意见!!! |