某单位,使用思科4500系列交换机作为核心交换机,有一天发现内网访问互联网丢包非常严重,通过如下步骤排查并解决问题:
(1)、内网ping交换机网关丢包也非常严重(怀疑是内网机器中毒了)
(2)、采用最笨的方法解决问题(一条一条拔线啊,用户最开始尝试的方法)
(3)、拔完所有线之后,网络是恢复了,但不知道是哪一根啊???最终发现是上传互联网的那根,只要那根线一拔线网络就好了,但那根线的对端是集团网络,人家集团网络是好好的。
(4)、没办法了,怀疑是病毒来自互联网,开始想办法找互联的问题
(5)、发现互联网那根线有大量的arp包,好几十万包,正是因为这个原因把交换机搞死的。
(6)、杀毒尝试过了、抑制ARP广播包也试过了,还是解决不了问题。
(7)、一不小心,发现管理员配置默认路由的一个不同之处,一般情况下,我们网关的下一跳地址,写的是对端的IP,而这个管理员他配置的是自己核心交换机的接口号(原因正是如此)
原因分析:我们在学习路由基础的时候,下一跳你配置对端的IP或者自己的接口都是可以通的,但两者的工作原因有所不一样;下一跳配置IP,走路由进行通信;而如果配置接口,则走广播,正是因为这个原因,从内网访问互联网的任何一个地址,核心交换机都会发广播进行请求,流量少的时候通信没有问题,但如果多了,ARP广播包就多了,慢慢就把交换机搞死了。 |