1.拓扑如下:某大学,总核心是锐捷s12010堆叠,每台设备上出一个口组成聚合口(万兆),下接两台AF9020,两设备主主部署,虚拟网线的形式。下联一台waf(其他品牌)。waf上下联均为聚合口。再下联锐捷s12006堆叠,每台设备上出一个口组成聚合口。交换机聚合模式为,二层静态聚合,基于源目MAC的哈希算法,负载形式。我不懂锐捷,询问过负载模式没有主备形式(两条物理线路都跑流量) 2.问题:之前院内一台PC访问服务器(web,dns),出现丢包的现象,后来在设备中打上了补丁包,主主同步会话用。丢包问题解决,但是出现了访问延时抖动的问题,延时达到100ms或者更大,与此同时设备cpu上升到40%。正常情况下PING服务器1ms,设备cpu3%。 3.排查:从设备上看,两台设备都有接受发送流量,但是不均衡,抓包也能明显看到来回路径不一致。分段ping测试,院内的PC(10.11.32.230)去ping自己的网关(10.11.32.1)总核心(192.168.127.1)ping数据中心核心(192.168.239.2),ping服务器(DNS:10.11.5.40/5.25/8.2,web:10.11.5.210).出现抖动时,网关,总核心任然时1ms,数据中心核心,5.40同时出现抖动。 192.168.127.1和192.168.239.1均在总核心上 4.找了锐捷工程师。了解到聚合口没有主备模式,但是可以改基于源目IP算法,会比MAC好一些(我自己理解的意思是负载更加均衡把。)然而没有用。还是一样的出现抖动。 5.之前也想过把设备改成主备模式,但是400说的没用,虚拟网线模式,传输数据完全靠上下行设备。备机接受到数据直接丢弃。我也测试了。果然出问题了,访问大量丢包。 6.和客户讨论。主备模式的时候,理论上讲端口聚合会协商不起来,可能是WAF聚合的问题。可以把WAF去掉在测试。 请问各位大佬:第6点的方案测试意义大么?有什么更好的解决办法呢?? |