本帖最后由 清风慕竹 于 2020-10-25 12:13 编辑
举例: 客户使用了某公司的AD设备做服务器负载,但是配置完成后无法访问服务。如何进行排查? 排查思路: 首先查看服务器相关的服务状态是否正常,然后根据我们服务器负载均衡的操作步骤和要求进行配置检查,检查设备的进程运行是否存在问题,若以上都没有问题后,进行抓包分析。 排查步骤如下: 一、状态查看 ①首先查看虚拟服务状态,查看虚拟服务配置后是否启用,链路是否可用,节点池是否正常等,如果繁忙、离线,则不能访问; 如果这里有相关的异常项,到相应的状态栏进行检查,同时如果我们在这里使用的缓存,我们可以在这里进行查看。 ②查看节点状态,节点是否离线 如果存在节点离线,到节点池中检查配置的节点监视器是什么,到节点监视器中检查节点监视器配置是否存在问题。 ③查看链路是否正常 如果链路离线、故障,到网络配置,网络接口中检查是否配置了健康检查,健康检查是否存在问题。 二、配置检查 1、检查访问的IP地址是否正确,是否配置了互联网ip地址,检查链路状态是否良好。 首先检查IP组配置的地址是否正确,如果IP地址没有配置在网络接口上,检查交换机是否有IP组网段的路由到AD设备接口。 2、检查配置的虚拟服务的协议和端口地址是否存在错误,对于配置为http服务的,可以尝试将http协议服务更改为tcp端口,把七层负载改为四层负载测试,访问是否正常。 3、如果是使用 cookie 会话保持,改用源IP会话保持看是否能恢复正常? 4、在AD上检查,客户端和节点服务器是否在同一网段,是否有添加到节点的静态路由?可以在webconsole中测试AD设备能否访问。 5、如果是网关模式,可以先禁用虚拟服务,然后建立端口映射,试着用用端口映射代替虚拟服务看是否访问正常? 6、如果节点在线,线路也未离线,如果AD是单臂部署,检查是否做了SNAT。 7、测试不经过AD是否正常。 三、进程检查 查看设备相关的进程是否运行正常,在系统配置-设备管理-webconsole中,使用check命令检查进行运行状态,是否存在未通过的项
四、抓包分析 1、在用户电脑上使用httpwatch抓包或wireshark抓包,检查AD是否有回应,回应的内容是否正常?httpwatch主要针对http服务,并且只能在ie浏览器运行,使用firefox的firebug也是可以的。 2、在节点服务器上抓包,检查服务器是否回包,源IP是否有问题,网关是否正确。 3、如果不是基于http协议的,有专门的客户端软件的,比如手机炒股软件等,测试时注意配置好虚拟服务后,要重启客户端。 |