提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

【AD】双机切换溯源问题排障概述

|

问题描述

问题现象:主备发生切换,需要溯源。
可能的原因:
1、链路故障
2、进程重启
3、设备重启、硬件故障

有效排查步骤

登录原来主机设备和新主机上分别查看服务日志,会打印出双机切换原因;基本上切换都会打印原因。
常见原因定位思路,如下其中两个案例:
a、链路故障触发切换:
高可用性 告警 17:41:07 设备主备切换成功,当前设备从[主机]切换到[备机],原因为:链路故障
高可用性 告警 17:41:07 本设备上的链路状态变为故障, 当前故障网口:[电信]
链路监视器 告警 17:41:07 [ 电信 ]离线,原因是监视器超时, 类型 [ARP]
链路监视器 信息 17:41:07 链路 [电信] 目的ip [61.184.173.129] ARP不可达
如上日志,就是链路监视器故障触发的主备切换,可以具体看出是哪个链路,什么故障触发的。

b、设备状态变化触发切换:比如主机磁盘只读,变为沉默状态,主备发生切换
主机上:
高可用性 告警 18:33:29 设备主备切换成功,当前设备从[主机]切换到[备机],原因为:硬盘故障
高可用性 告警 18:33:29 当前设备是主机,检测到本设备由[在线]变为[沉默],原因为:设备的磁盘故障
高可用性 告警 18:33:28 文件系统只读,只读分区为:/virus
备机上:
高可用性 告警 18:32:44 设备主备切换成功,当前设备从[备机]切换到[主机],原因为:硬盘故障
高可用性 告警 18:32:43 当前设备是备机,检测到对端设备由[在线]变为[沉默],原因为:设备的磁盘故障
如上日志打印状态变化,触发切换原因:磁盘故障导致。

解决方案

如上

我要分享
文档编号: 222095
作者: admin
更新时间: 2023-05-05 10:35
适用版本: