问题背景 在一次割接防火墙,迁移业务到深信服防火墙后,测试主备切换出现多次网口故障,故障恢复较慢,达不到预期效果
问题分析 1、主备状态切换异常 主机先部署迁移,备机后接入出现内网口检测同时故障状态,反复切换导致运维同事ping包没有恢复并且上网短时间内反复掉线。
经过分析发现由于之前部署负载策略内外使用的都是是负载均衡-RR模式
更换lacp模式之后测试单台运行没有问题 依然存在切换主备接口起不来的情况
最后更换负载均衡-hash模式,测试切换没有问题,丢包在正常范围内。 负载均衡--hash:按数据包源目的IP/MAC的hash值均分 负载均衡--RR:直接按数据包轮转均分到每个接口(轮流转发
2、出现主备频繁切换的情况 前两次测试主备切换 在故障日志看到存在 恢复抢占时 聚合接口出现链路故障检测ping失败的情况,导致没有及时切换到主机 等待一段时间后维持主机
因此判定防火墙与交换机之间协商的负载策略确实存在问题
问题总结 故障切换异常主要是由于交换机跟防火墙的负载策略存在问题,由于早期环境是四线聚合,并且使用负载均衡-RR,容易出现活动聚合接口不在同一台防火墙上,导致两台设备都链路检测故障恢复时间较长。
解决方案 防火墙主备切换异常,原因已经明确,已经修改负载策略测试正常 |