本帖最后由 哒哒哒 于 2019-10-31 21:02 编辑
-------背景------- 今天楼主本来是个非常非常开心的日子,一个上午都没有事情,吃过午饭正美滋滋的喝着热水刷着微博,突然一个电话打破了这种和谐的气氛。怎么回事嘞,原来客户在做网络改造的时候,就是由单网桥改为双网桥的时候,发现第二对网桥口的数据无法上网。怎么办呢,当然是开始解决问题啦。
-------网络拓扑------- 根据客户提供的信息得出以下拓扑 环境说明:在核心上做了策略路由,内网不同的业务走不同的出口上网,设备双网桥部署,网桥未配置地址,使用带外管理口直接接到核心上。
-------排错步骤------- 1/这种问题,第一步想到的当然是开直通啦,然而开直通之后依旧无法上网; 2/仔细分析下环境,从理论上并无任何不合理之处,于是开始一步一步的验证; 穿插:给客户解释设备网桥部署不参与任何的路由转发,而且开了直通设备就处于虚拟网线的状态。
3/让客户在内网上ping出口的LAN口地址,结果是通的,说明AC并没有做拦截,并且AC下联的设备应该也灭有问题,排除掉核心和AC的问题; 4/在内网上ping设备的WAN口地址以及公网上的一个地址,结果不通,怀疑问题出现在出口路由器本身,但是又没有直接的证据,怎么办嘞,直接登陆出口自己查; 5/想办法登陆上出口之后(答应客户只看不改配置),开始做验证,当然第一步还是先看下配置,恩,配置看起来是没问题的; 6/在设备上直接ping公网地址,不通,带源(LAN)ping公网,依旧不通,于是截图给客户解释 7/终于找到证据了,后来发现是路由器的wan口down掉了,本来以为可以继续喝茶,可以客户的一句话又把我带了回去; 8/客户问我做了什么操作,我好像什么都没做啊,上午还好好的,现在怎么又宕掉了,还好我机智,运行了下历史记录,确实是只在看,没动任何东西啊; 9/接口恢复之后,再次测试,测试结果是通的,在AC上查看下结果,恩,流量也要经过4和5口了。 10/至此,故障解决
-------故障分析------- 出现故障不要捉急,先喝口水,摆好姿势,冷静10秒钟,脑子里那些什么八卦啊/肥皂剧情啊/各种中二的想法啊先放一放,然后理清思路,一步一步来,遇到网络不通的,建议一跳一跳的排查,到哪一跳不通基本上就是哪台设备的问题了。
|