提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

基础排查-第一步:获取前端日志判断是否为可修复内存ECC

|

问题描述

获取前端日志判断是否为可修复内存ECC

告警信息

适用于不需要返修解决的场景
1,前台未有持续告警且没有造成宕机或者主机重启现象
2,最近一周前才有历史告警
3,未达到判修标准(第三步)的可修复ECC
4,经过硬件技术确认过不需要返修的场景

有效排查步骤

使用adeploy工具对集群进行巡检,巡检日志告警可修复内存ECC错误;下载链接:http://adeploy.sangfor.com:8080/ ... -server-install.zip

根因

偶发的、非持续多天报大量可修正的ECC

解决方案

1,进入IPMI控制台,清掉IPMI日志,然后将BMC重启
备注:如果是一体机,可以在IPMI控制台重启BMC,一体机重启BMC的方法
2,或者在具备重启主机的条件下,建议重启ECC报错的主机,观察是否能恢复页面的告警

操作影响范围

清日志前建议保存一下日志、重启BMC时建议先保存一下BMC配置以免IPMI的IP丢失
重启BMC不影响主机业务

建议与总结


排查内容

如果上述方式仍然有新告警产生,需要进一步分析日志
将IPMI控制台的告警日志导出文件,提交给400工程师分析

我要分享
文档编号: 219367
作者: admin
更新时间: 2023-01-05 17:29
适用版本: