一、问题描述
1、查看当时的整体流量不大,进一步排查设备实际内存占用情况,发现是由于dataplane进程(该进程属于设备管理流量转发及安全功能使用的进程)占用内存过高导致。 2、由于当时已经影响业务,紧急重启设备后恢复正常,但是使用一段时间后,下午内存占用又变的很高,于是远程排查发现客户的并发连接数近120w,由于连接数会实时占用设备内存,进一步导致设备内存不足。 3、进一步排查策略发现设备有针对所有开启长连接,而AF所有的应用控制策略勾选长连接选项,仅用于支持访问有长连接请求的特殊服务器,使连接请求不受防火墙连接超时的影响,开启此功能会使连接释放变慢,可能会导致连接数逐渐增加达到AF连接数的上限及内存占用过高,引发其他会话无法申请到内存使用,进而导致用户断网问题。 4、经客户同意后关闭了长连接,但是由于会话数没降下来导致内存还是占用高,需重启设备恢复,由于客户无法长时间影响业务,跳过AF设备后恢复网络,且AF上的连接数以及内存恢复正常。
三、问题原因 设备开启长连接后导致设备并发会话数过高,引发其他会话无法申请到内存使用,进而导致用户断网问题。
四、解决方案 1、关闭长连接使得并发会话数不高 2、8.0.95有针对dp内存进行限制且解决了很多已知问题,建议可以同时升级版本
|