问题描述
如果虚拟存储中的磁盘出现坏道,可能会引发数据同步,数据重建或者虚拟存储卡慢等问题,此时可以通后台检查磁盘的smart信息确认是否存在磁盘坏道或故障
后台使用smartctl -A /dev/sdx查看磁盘信息是否有坏道
主要关注5,197,199这三个数值是否不为0
5 Reallocated_Sector_Ct ...... 0 #被重定向到保留扇区的数量,建议换盘
-> ****** 坏道问题:当RAW_VALUE的值大于0,说明该磁盘有坏道。
...
197 Current_Pending_Sector ...... 0 #当前识别到的坏道扇区
-> ****** 坏道问题:当RAW_VALUE的值大于0,说明潜在坏道问题
...
199 UDMA_CRC_Error_Count ...... 0 #建议物理拔插磁盘,观察值是否还会增长
-> ****** 插槽问题:如果数据值不为0且持续增长,表示硬盘控制器→数据线→硬盘接口出现错误,劣质的数据线、接口接触不良都可能导致此现象。
有效排查步骤 若界面磁盘有离线,如何定位磁盘盘符情况在对应后台执行命令
- grep UN /sf/cfg/vs/disk/*
复制代码 即可得到状态是UNORMAL的磁盘配置文件名,再cat这个文件名即可获得到磁盘的盘符
解决方案 还可以使用for循环命令检测当前主机上所有磁盘(不影响业务) - for sd in $(ls /dev/sd[a-z]); do echo ---$sd---; smartctl -A $sd | egrep "Current_Pending_Sector|UDMA_CRC_Error_Count|Reallocated_Sector_Ct"; done
复制代码执行后效果如下,如果有数值不为0的磁盘,需要联系硬件部确认是否需要更换磁盘。
操作范围影响 |