提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

二、业务突然全部中断基础排查:设备状态、基本策略和配置排查

|

问题描述

业务突然全部中断、突然内网断网问题基础排查

告警信息

可能原因如下:
1、故障期间调整过策略——确认具体的问题现象和操作,故障前是否做过调整,网络变更和割接,检查操作日志
2、AF策略拦截或添加了黑名单——开启定向、全局直通,对客户业务涉及的I域名、IP等加白后,测试是否可以恢复
3、源目地址网段的路由学习异常——检查防火墙上的路由情况,是否有异常,比如出接口或者下一跳和预期的不一致
4、源地址转换策略配置错误——检查对应的源地址转换是否有匹配数,地址转换策略的源目区域,IP对象是否包含无法上网的网段
5、接口状态异常——查接口状态是否为UP、接口协商速率是否异常(正常一般为千兆、万兆)、接口链路检测是否异常
6、设备故障导致——查看设备状态,确认设备状态灯是否正常,是否有红灯常亮的情况
详细操作方法可以参考下列有效排查步骤说明

有效排查步骤

1、与客户确认故障时间点是否有配置改动,可通过查询AF操作日志确认,常见为修改地址转换、ACL、黑白名单、DDOS策略、接口联动、路由等配置
PS:紧急情况尝试和客户沟通恢复变更之前的配置来恢复网络,如果客户反馈没有进行过任何改动、或者有改动,但是恢复之前的配置业务还是无法恢复,进入下一步;

2、开启定向、全局直通,对客户业务涉及的I域名、IP等加白后,测试是否可以恢复。如果开启定向、全局直通后业务恢复,检查直通日志,分析日志确认拦截原因,沟通调整对应的策略、配置。
直通日志丢包标记和对应的丢包模块关系如下:

直通:


黑名单:


3、检查设备路由是否正确,是否有正确的回包路由和策略路由,使用路由测试功能看相关的内网地址和目的地址都有路由,并且路由出接口是正确的。


4、检查对应的源地址转换是否有匹配数,与客户确认后,可以清空现有的匹配数来看情况后是否有匹配数增加;检查地址转换策略的源目区域,IP对象是否包含无法上网的网段,确保地址转换策略配置没有问题。


5、确认链路状态是否是正常的。是否存在链路故障的情况,接口是否还是正常协商,没有接口异常断开等情况。
PS:特别注意客户是否配置了接口联动导致业务口宕


6、确认设备状态灯是否正常,是否有红灯常亮的情况。如果有红灯常亮,尝试重启看是否可以恢复,并转L2处理。
AF指示灯各种情况注释:

解决方案

以上步骤未解决您的问题,可收集以下信息问题流转技术支持工程师:
1、故障现象描述:
2、机房环境是否正常,有没有掉电、网线插拔、交换机配置更改等操作
3、设备面板是否有红灯常亮的情况出现
4、设备部署模式、网络拓扑、设备版本信息:
5、开启直通后是否正常:
6、故障影响范围:
7、已做过的排查:
您可以通过关注微信公众号【深信服技术服务】自助提单或者拨打400-630-6430提单

我要分享
文档编号: 222483
作者: admin
更新时间: 2023-04-10 10:59
适用版本: