客户拓扑及流量示意
【问题现象】 1、2023 年 5 月某单位反馈网络里面使用AF 设备(虚拟网线+双机聚合,8.0.45版本),出现 “访问业务卡慢”情况(拓扑中跨网段访问、客户端访问业务两种流量方向),上下联光纤绕开防火墙直连服务器区和核心交换机后业务访问恢复正常。
【问题分析过程阶段一】 1、 观察AF的web控制台,发现有数据同步口流量跑满(网口带宽1G,实际流量980Mb),判断需要将多个网口聚合之后作为数据同步口来扩容带宽。
2、 在查看黑匣子后发现pro_cpu_use文件中记载,在故障时间段出现多次cpu0单核跑满的情况,判断出现性能问题,需要重新上线业务后抓包确认具体流量情况。
【处理步骤阶段一】 1、 按照分析,单个千兆电口作为数据同步口带宽不够,则将3个1Gb带宽电口聚合为aggr.1,再作为数据同步口。
2、 重新将上下联光纤串接进防火墙并观测业务情况
【问题分析过程阶段二】 1、重新上架后管观察到数据同步口流量未超过3Gb。
2、但是业务和ping依然出现延时高,丢包的情况;同时cpu0也出现了单核跑满情况
【问题根因】 1、 经协调研发分析相关数据包和黑匣子文件,最终确认为数据包因本身在业务环境中带了vlan,经过AF数据同步口转发之后会带上一层数据同步口的vlan。从而导致数据包在数据同步口之间传递的时候存在双层vlan问题,让设备的CPU0负载增高,单核跑满。
【规避方案】 1、 需提交变更流程,打上对该问题进行优化的补丁包KB-AF-20220623-fix-mpkt-exchange-double-vlan-8045
注意: 1、升级会重启设备;不需要拆双机,可以直接按照备控-->主控的顺序直接升级 2、 8.0.45版本打包之后,如果升级48,需要先回滚包,接着升级,最后再打8.0.48版本的问题优化包 3、 该问题在新架构的8.0.85版本仍然存在,具体优化方式需要联系CTI进行支持。
|