##解决方法-----重启,升级
一,背景 上周6客户处突然电话说网断了,AD主备切换了。
上拓扑(全家桶,口子型) 默认左边链路为主 AD-主备 AF-路由主备 开启抢占 左边为主(链路检测未开启) AC-网桥双主
二,处理 1.电话了解到,AD设备主备切换了(客户上机房 看得备机红灯闪烁),网内不能登录AD设备,网断了 2.告知客户,把主AF设备网线断开,让流量走备机,先恢复网络 3.大约20分钟后,网络恢复了。流量全走备机。接到电话的时候 我就已经在路上了 4.客户登录AD备设备,日志查看,检测到心跳口故障,主备切换 而且 检查过心跳线 都是正常的。截图:
问题出来了, 心跳口都接着线的 但是一直显示故障。 5.业务正常了,下一步就需要找到原因,提前让客户开了远程维护,让400客服先看下备设备,去除了备机的登录限制,。外网能登录设备了。 6.到达客户现场,客服需要查看主设备日志。直连AD主设备,登录发现有登录限制 ,让400客服后台去掉限制,发现怎么都登录不进后台, 7.心跳口一直处于故障状态,备设备ping主设备心跳口不通,但是能获取到MAC地址,用笔记本直连主设备心跳口,ping不通,获取不到MAC 8.事件升级,研发建议重启设备。--------------------------至此设备能登录上了,日志没了,心跳口也起来了。一片安静祥和 9.原因
、
三、后续 1.设备升级,AD705----708 2.AF去掉抢占,开启链路检测保障双机切换(客服建议)
四、问题 1.不是很明白磁盘从软件层面只读--接口直连不通? 2.AF同时开启抢占和链路故障检测切换时会出现什么问题? |