“当前已有100+用户参与分享,共计发放奖励60000+“
一、问题背景客户有电信、联通、移动三条运营商线路,客户之前用我们单台AD网络一直没问题,近期新购一台AD做了主备,做了主备没几天就发现上网异常,客户非常坚定的认为是我们AD组双机导致的问题。
二、问题现象 (1)上网时快时慢,具体表现在打开网页加载慢或者偶尔打不开,但是客户说有的用户慢,有的快,且不是一直慢,感觉很诡异。 (2)用户有个业务需要通过web上传文件,现在上传经常速度不到1Mbps,偶尔也比较快,之前稳定50Mbps以上。 所有的网络问题本质上都是数据包转发有问题,客户描述的现象看似很诡异,实质上我们其实不需要关注太多表面现象,我们做为网络工程师,第一步就要去抓数据包转发层面的异常,首先去定位看是那一个设备数据包转发异常导致上网异常,进而在排查对应有问题设备或线路。
排查步骤: (1)找到一台上网异常的电脑,发现这台电脑打开163.com比较慢,经常转圈,执行ping 163.com -t,ping了几十个包看着没啥异常,丢包延时都正常,执行ping 163.com -t -5000就发现严重丢包。——到这里可以明确是因为网络丢包导致的网站打开慢,这时就需要排查哪里丢包。 (1)跟据经验,我依次ping x.x.x.x -t -l 20000电脑的网关地址、AD的LAN口地址、AD的WAN口地址、WAN口的下一跳地址,发现ping WAN口下一跳地址是存在严重丢包——已经定位到AD-运营商这一段有异常,下一步就是判断是AD的问题还是运营商的问题 注意:我们测试的时候一定要试试ping大包,比如ping x.x.x.x -l 20000或者30000等,ping大包会放大丢包率,让我们容易看出问题。 (2)要判断是AD的问题还是运营商的问题有多种方法比如使用笔记本直连光猫,配置光猫地址进行ping测试、上网测试;在AD网口抓包,分析数据包查看是AD没发包还是发包后没有收到包等。客户一般比较容易接受第一种方法,于是就用笔记本直连光猫测试,发现ping x.x.x.x -t -l 20000依然丢包很严重,这样基本实锤不是我们AD的问题了,客户叫来运营商重启了一下光猫,所有问题都解决了。
四、总结 1.上网慢,不要慌,挨着ping就能定位大体故障点 2.ping测试网络时要ping大包才容易看出问题,推荐命令ping x.x.x.x -t -l 20000,小包容易迷惑人。 |