【问题现象】
1、超融合平台有存储丢包告警,告警主机为延伸集群2个故障域之间的主机,导致虚拟机业务不定时卡死。 【问题处理过程】 1、登录超融合在系统诊断ping对应主机的存储口,发现丢包时间和虚拟存储时延瞬时增大的时间匹配,确定是网络丢包导致的虚拟机业务卡顿。 2、排查存储交换机侧的问题时发现存储口上有大量的错误包 3、关闭存储交换机的STP协议和LLDP协议后仍存在丢包问题。 4、查看交换机日志后发现交换机上有ARP攻击,且攻击时间和丢包的时间大致匹配,关闭发送ARP攻击的设备后仍然有丢包现象。 5、查看对应的端口信息发现该端口的光衰过大,确认为光纤线或者光模块的问题 【解决方案】 1、更换核心交换机到超融合的光纤线后,虚拟存储延时恢复正常,且问题未复现。 |