【业务恢复】
确认设备是否能登录:
1、设备无法登录:
①硬件问题:设备alarm灯红灯常亮,设备直连无法ping通,设备没有接显示器接口/console接进不去,通过重启AC设备尝试恢复,若无法恢复,则想办法替换/跳开设备,保障业务正常
②软件问题:设备控制台登入端口被改,设备sangfor_waf进程异常等,详情请参考控制台无法登录
2、设备能正常登入:
① 开启拒绝列表并直通/搬包/替换/跳开AC测试,策略/物理上排除AC影响
②确认问题出现之前是否做过什么改动:
可通过恢复之前的配置来恢复业务
③获取数据具体走向,通过抓包判断问题并解决问题;
④若以上操作无法帮助您快速恢复客户业务,请及时收集下列解决方案中的信息转研发协助;
写在前面:如果是刚部署上架无法上网,大概率为配置错误导致,可参阅路由部署配置指导:点击这里
1、确认出现断网前是否做了网络变更操作或调整了相关设备配置
确认问题出现的具体时间,核对问题出现时间前后设备本身策略配置或者网络环境是否有做过调整,确认是否变更不当导致的断网
2、开启直通、全局排除、搬包均无法恢复正常访问,则基本判断非设备认证、权限策略等拦截导致
3、若开启直通恢复正常则可基于具体问题转到对应场景进行调整放通,直通全局排除指导:点击这里 常见丢包模块如下:
①用户认证丢包:可登录设备控制台,使用【全网监控】-【故障监控中心】-【用户认证故障排查】工具进行排查,输入用户IP可查阅具体原因及建议,常见问题是用户未认证或绑定校验失败
②应用控制丢包:可登录设备控制台,使用【全网监控】-【故障监控中心】-【权限策略故障排查】工具进行排查,输入源IP可查看具体连接匹配策略情况,常见问题是策略未放通导致被拒绝
4、如果设备无法正常登录,请分级ping 测试验证断网区段(如果其他设备能通,AC不通,则检查设备硬件是否正常,条件允许可直连设备登录控制台确认)
5、抓包分析数据转发情况,进一步确认断网原因,并制定解决方案
6、如果定位非AC设备导致后,想进一步定位问题原因可参考如下思路:
①修改PC的DNS为114.114.114.114或223.5.5.5进行测试,排除是DNS解析异常问题
②如果出口为多线路,可调整AC设备的链路负载策略,走其他线路进行测试,排除是运营商线路问题
③内网其他安全设备,有ACL策略的设备上添加白名单进行验证,排除是其他设备拦截