提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

上网慢ping包有丢包延迟的可能原因及排查思路概述

|

问题描述

【适用场景】
本场景适用于客户反馈内网终端上网慢,ping外网有延迟或丢包场景
1、ping包有丢包延迟大
2、网站打开慢、视频加载慢

【基本原则】
以优先恢复客户业务为第一要务,在业务恢复后在进行问题原因的排查

告警信息

1、确认问题影响范围:
  •     是内网所有用户上网慢还是个别用户上网慢(所有人上网慢需注意业务影响,及时恢复业务)
  •     是一直上网慢还是不定时出现



2、确定丢包延迟位置:
  •     丢包延迟的源目IP地址分别是什么,如果是全网都受影响,则先找一台测试终端
  •     内网网络拓扑结构,设备什么模式部署,设备上架使用多久了
  •     确定测试终端ping包流量是否经过AC设备



3、确定出现故障前是否存在变更操作:
  •     出现问题前是否有调整过我司设备或第三方设备配置
  •     设备针对丢包IP开启直通/全局排除是否能恢复正常


有效排查步骤

【业务恢复】
确认设备是否能登录:
1、设备无法登录:
①硬件问题:设备alarm灯红灯常亮,设备直连无法ping通,设备没有接显示器接口/console接进不去,通过重启AC设备尝试恢复,若无法恢复,则想办法替换/跳开设备,保障业务正常
②软件问题:设备控制台登入端口被改,设备sangfor_waf进程异常等,详情请参考控制台无法登录

2、设备能正常登入:
开启拒绝列表并直通/搬包/跳开AC测试,策略/物理上排除AC影响
②确认问题出现之前是否做过什么改动:
    可通过恢复之前的配置来恢复业务
③获取数据具体走向,通过抓包判断问题并解决问题;
④若以上操作无法帮助您快速恢复客户业务,请及时收集下列解决方案中的信息转研发协助;

【可能原因】
第三方产品&环境问题(开启直通或全局排除依旧无法恢复的现象中此类原因居多)
1、运营商线路问题
2、内网其他安全设备拦截
3、网口协商异常,网口存在丢包
4、PC的DNS解析异常导致
5、内网地址冲突导致

功能配置问题
1、DOS防护配置不当导致,开启直通可验证
2、流控策略限制太小(单用户限速过小、流控带宽显示过小),开直通可以恢复

软件功能问题
设备红灯长亮或出现负载跑满导致网口丢包,跳开设备可以恢复(红灯闪烁只是存在系统日志告警)

解决方案

排查思路
1、确定丢包延迟位置
        1.1、确保流量经过AC设备
        1.2、分级ping测试定位故障位置
2、直通、全局排除、搬包定位原因
        2.1、直通能恢复则根据直通日志具体排查
        2.2、直通不能恢复,则开搬包判断是否恢复
3、抓包并分析数据包
        3.1、在AC设备内外网口同时抓测试PC的IP数据包
        3.2、对比分析AC设备内外网口的流量转发情况

建议与总结

1、在设备【系统管理】-【系统诊断】-【上网故障排除】中开启直通看是否正常,直通后若没有再丢包,可以将【安全防护】-【防DOS攻击】、流控依次关闭定位下问题
2、在【系统管理】-【系统配置】-【全局排除】-【自定义排除】将测试用户的ip或者是目标域名加入到全局排除看是否正常
3、检查设备CPU、内存情况是否常期处于80%以上,若一直过高则设备负载有问题
4、在AC和直连设备之间放入小交换机然后测试下,排除因为网口兼容问题导致
5、在PC上由网关一级一级往上ping,看到哪里丢包,看下是不是因为其他设备导致
6、在命令控制台执行ifconfig检查设备网口是否存在丢包,如果有丢包,则执行ethtool检查相应的网口是否协商工作模式错误,例如协商为半双工,千兆口协商为百兆等

排查内容

联系技术支持建议提供以下信息
1、故障现象描述:
2、故障发生时间:
3、故障影响范围:
4、故障前做过的操作:
5、设备部署模式及网络拓扑:
6、设备详细版本信息:
7、排查过程的配置截图:
8、如果抓取了数据包提供对应抓包条件和相关数据包文件:

我要分享
文档编号: 221529
作者: admin
更新时间: 2023-05-19 08:51
适用版本: