问题背景:
已知某用户AD1,AD2组建集群模式,半夜外网移动线路发生中断,但是排查发现另外一条外网线路联通也无法正常上网。 排查过程: 1、巡检确认AD是否存在问题。经过巡检发现AD设备正常。 2、检查AD地址转换与只能路由是否存在配置问题。 3、检查AD集群主备控切换是否存在问题。 4、查看日志是否有告警。 最终结论: 晚上23:21:26时ad1内网口检测到异常主控切换到了ad2上,23:21:28时移动进线也离线导致ad2主控又再次切换到ad1上,这时候ad1的内网口因为时离线的,导致终端一直无法上网。半夜1:28时内网口移动专线恢复正常以后,终端又可以上网了。 由于切换条件设置不太合理,内网外网任意断一条链路就会发生切换。应该配置为可以改成内网,内网➕任意外网,两个外网这三个条件满足一个再切换。 注:AD集群搭建,设备切换时只关注是否满足切换条件,不会检测备机是否存在故障。 |