本帖最后由 Sangfor_闪电回_小云 于 2015-11-26 10:10 编辑
AC&SG常见故障排除步骤及方法
一、利用设备直通模块和全局排除模块快速定位故障
当内网架设了AC&SG后发现某些应用不能正常使用或者上不了网时,首先我们可以通过开启设备的直通模块,观察业务是否正常(如果正常观察显示出来的故障日志,查看是那个模块丢包,然后做进一步处理)
如果开启直通后仍然不正常,可以尝试使用设备全局排除进行判断: 首先我们可以找一台故障机器,将该机器的IP地址写入全局排除列表中,然后观察故障是否解决。
如果解决那么我们可以通过比对:开启设备直通和全局排除地址后任然生效的模块来进一步定位问题。设备直通模式下任然生效的模块如下:开直通后,仍然生效的模块有nat,邮件过滤,邮件延迟审计,网关杀毒(smtp和pop3杀毒),ssl内容识别,代理+cache,arp欺骗防护,系统路由和策略路由;全局排除后任然生效的模块:防火墙规则和防DOS攻击。所以当直通后故障无法解决,但是开启全局排除地址后正常时:我们可以通过分析直通模式下任然生效的模块来进行故障定位判断。
下面以技术论坛上的一个故障为例分享我的排查过程: 客户反映https://mp.weixin.qq.com这个微信公众平台打不开,开启上网故障排除也没用,不知道是哪条策略控制了?行为管理开启了qq白名单有关系吗?通过沟通了解客户对自己的电脑IP进行全局排除后可以正常打开。我就对该问题有了方向,比对两个模块下任然生效的模块:根据经验我直接排除了除ssl内容识别,代理+cache之外的所有模块,然后由于客户访问的是https形式的资源所以进一步排除代理+cache,那么问题就只剩下SSL 内容识别,让客户查看该选项发现果然是该模块导致的问题,去掉该项后恢复正常。
二、合理利用内置数据中心日志查询功能精确定位故障
大家是否经常会碰到这样的问题:经常会出现QQ图片发不了或打不开;打开网页显示不正常的问题?开启直通后问题解决,但是故障日志显示太过粗糙,只有URL过滤丢包等提示。但是URL分类库那么多到底是那个分类影响了?是不是有一种无从下手的感觉?这时我们可以通过内置数据中心的日志查看的强大功能来精确定位故障(当然前提是你要开启上网审计策略): 首先我们打开内置数据中心,打开日志查看,查看上网行为日志; 然后找一台故障机器把这台机的IP填入查询条件里面,再次我们关闭设备直通,开始在故障机上进行故障重现; 最后通过查看数据中心该机器的上网行为日志,找到被拒绝的动作然后点开该日志进行分析判断,最后根据日志里显示出的URL进行进一步操作,我们可以把这些URL在URL库中自定义出来然后通过策略来进行放通达到解决问题的目的。
三、SG设备打开网页不正常排查
经常会碰到SG设备打开部分网页不正常的问题,然后开启设备直通后问题解决,但是这时候发现设备直通日志里面什么提示也没有。这时候想要判断具体问题真的有些头大怎么办:经验告诉我,先关掉直通然后关掉设备的加速模块,问题90%以上会解决,然后我们就可以有进一步的故障处理方式: 1、清空设备加速缓存(能暂时解决该问题) 2、尝试开启故障网址的加速排除。不过为了不再出问题我还是建议能不开加速就不开吧,这模块有时候会有缓存问题。。。 |