提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

基本排查-步骤二:检查服务器本身服务是否正常

|

问题描述

检查服务器自身的服务是否正常,可直接访问服务器来测试结果,如果服务器自身都异常,必然会影响到通过负载的访问,比如某客户的节点服务器非常不稳定,老是故障又恢复!

有效排查步骤

1、检查对应故障虚拟服务是否配置关联节点监视器,以及检查相关节点监视器配置是否正确。


2、控制台Webconsole使用sock命令检查AD到后端节点通信是否正常,【例如 sock 192.168.10.10 443】


解决方案

节点不稳定离线,主要分为以下两种场景:
一、频繁离线处理思路
1)节点频繁离线一般为传输层(tcp_connet 三次握手)或应用层监视器(内容tcp或http)
①检查节点新建数,并发数是否较大,较大连接数会影响服务器回包。
②tcp_connect三次握手,内网电脑可以使用tcping工具直接测试服务器端口是否有超时,tcping工具见下面附件。
将tcping64.exe工具放至C盘根目录,cmd命令行执行cd / 切换到C盘根目录
执行命令,例:tcping64 10.3.2.3.253 85   //测试IP地址的TCP 85端口,默认执行4次端口探测

③确定AD到服务器之间是否有安全设备,业务触发阀值,安全设备拦截了监视器包。
④AD抓包,参考离线时间点找包,有条件的话服务器上可以同时抓包。

2)若服务器本身就是性能不足响应慢或慢回应机制,检查监视器是否配置合理,重要参数:超时时间是否合理;若是应用层监视器,可以将超时时间延迟如5-7秒左右。


二、频繁离线处理思路
不定时离线需要查原因,部署抓包定位,参考节点离线日志时间点找包,如何使用抓包见下一步骤内容。

建议与总结

补充:
案例1:发布虚拟服务后,客户端访问白屏,某个子页面加载显示404
1、调试默认确定子页面连接报错情况

2、测试电脑写host直接用域名访问服务器,判断是否服务器有host限制,测试正常代表无限制。

3、AD后台直接wget子页面连接分别访问两个节点服务器,测试结果为某个服务器节点返回404,确认问题原因为AD到该服务器节点中间或服务器的问题。

解决方案:中间设备排查或排查服务器。

我要分享
文档编号: 221497
作者: admin
更新时间: 2023-04-06 10:40
适用版本: