一、故障问题 用户:AC1200(版本为AC5.4、网桥模式部署)2014年采购,近期客户多次反映登录设备控制台缓慢(表现状况为:在浏览器地址栏输入设备管理地址,输入用户名和密码后,“提示:正在登录,请稍候...”);然后好久之后就是“错误:从服务器获取数据失败”(PS:既是登录成功,在资源信息处CPU也是一直在100%) 图一(提示: 正在登录,请稍候...):
图二(错误:从服务器获取数据失败):
图三(CPU也是一直在100%):
二、原因分析 针对客户这种情况,通过搜索论坛往期的问题帖和分享帖,总结了下引起这种问题的原因有以下5点: 1.设备选型问题(选型失误,客户带宽和用户数超过设备实际所能承载的性能);
2.部分版本路由配置不当导致设备负载较高(网桥模式下,内网含有三层环境,没有添加相应回包路由);
3.DOS攻击导致(内网有并发量大的服务器或者内网中毒大量发包导致设备CPU负载高);
4.磁盘占用率高(内置数据中心日志量大,导致设备CPU负载高,内存占用率高)。
5.RST包死循环;
针对以上五种原因做了排除,最终定位在第4项原因引起的(内置数据中心日志量大,导致设备登录缓慢):
在400客服人员(sangfor -2170-AC)的技术支持下,通过升级客户端的方式登录到设备后台(web界面登录缓慢),发现从2014年设备一上架到现在(忘记截图了)每天的日志数据都保存在设备里,虽然占用磁盘空间不是很大,但是日志量很多。由于客户需要保存配置以及日志,因此客服人员从后台打上优化补丁包(KB-AC-20141023-401-015.0-6.0),设置保留天数(180天)来进行日志自动删除操作。
PS:400客服说删除日志有段时间大概2-3天,但是事实上没有这么快(我估摸着时间得有二十天左右);时间点:3月2日删除的日志数据;3月14日客服人员联系我是否问题解决,我登录客户设备还是挺慢的;3月27号准备在去客户现场的时候我通过远程登录到设备上,设备正常;虽然时间有点长,但是问题顺利解决了;感谢sangfor -2170-AC工程师!此处点赞!
在400客服建议以及上网行为管理技术PPT介绍下,对配置审计策略进行了优化:
三、处理结果 访问设备控制台正常,CPU资源同样正常;
四、解决途径 通过bbs.sangfor.com.cn在线咨询的方式,联系到400客服人员的;从收到服务单号到接到工程师电话大概10分钟时间(效率还是蛮高的)。PS:如果400电话打不进去,可采用论坛在线咨询的方式,或许有不一样的效果。
|