本帖最后由 新手226004 于 2025-3-7 14:53 编辑
环境:AC路由部署作为出口,拨号上网,AC以下皆为二层环境。
问题: 用户网络不定时不定次数中断1到2分钟后自动恢复。 排查过程: 1、取设备黑匣子分析,发现设备拨号上网接口一天会down、up若干次,看字段event=4为被动down(如下图),初步怀疑断网与此有关,遂在光猫与AC之间加二层交换机兼容,接口反复down、up问题解决以后,但不定时不定次数断网问题仍然存在。 2、继续取日志分析,发现设备有重新拨号的情况(如下图),多次重新拨号的时间点与客户多次反馈的断网时间点吻合。基本确认客户侧断网是由于设备重新拨号导致。 3、进一步结合放置的抓包脚本数据包来分析设备重新拨号的原因,从数据包来看,AC与运营商之间的ppp链路存活检测交互有异常(如下图),即AC发起三次request请求,每次间隔20s,没收到回复以后,AC重新发起拨号,此时断网。 原因分析: 1、运营商侧不回包,导致AC重新拨号,导致断网。 2、需要优先找运营商侧排查问题,找出ppp链路存活检测包不回复的原因,其次尝试关闭AC设备ppp链路存活探测机制,不发包检测,看是否能解决问题。 解决方案: 1、最终运营商侧未排查出问题原因,通过后台关闭AC设备ppp链路存活探测机制(找400操作),观察设备未再出现频繁重新拨号情况,客户也未再反馈断网问题,问题解决。
备注:此类问题非设备侧问题,完全是死马当活马医(关闭发包检测也不一定能解决问题),该问题根本原因还是运营商侧不回包导致。 |