本帖最后由 大蒜头 于 2017-6-29 00:15 编辑
背 景 客户使用应用交付AD做服务器负载和入站链路负载。客户拥有两条线路,分别为联通和电信。AD设备做旁路双机部署。入站链路负载,AD开启智能DNS。部署拓扑简单如下
.·°∴ ☆..·°.·°∴ ☆..·°.·°∴ ☆..·°.·°∴ ☆..·°.·°∴ ☆..·°.·°∴ ☆..·°.·°∴ ☆..·故障现象:客户某ERP系统无法正常访问,但是使用联通访问正常。其他的运营商均不能正常访问,但是使用联通外网IP地址可以正常访问ERP系统。 排查故障过程:依次使用电信网络和移动网络均无法访问。在电脑终端使用nslookup命令,解析出来的均为电信链路公网地址。怀疑电信链路故障。经过测试排查,确认客户电信链路故障。
━━●●━━━━━━━━━━━━━●●━━━━━━━━━━━━━●●━━━━━━━━━━━━━●●━━━━━━━━━━━━━●●━━━━━━━━━━问题延伸:某公司应用交付AD设备,做智能DNS,如果出现上述电信运营商故障现象,那么我们在使用电信或者移动网络访问该ERP域名的时候,那么解析返回的地址应该为正常链路的外网地址,也就是可以正常连接的联通地址。
问题延伸排查:检查AD设备配置,发现AD设备在智能DNS中的虚拟IP检查,设置为PING&CONNECT(TCP),点开其详细配置信息,检测IP为 *,也就是说它所检测的为出口防火墙上的外网地址,这就造成某条链路故障,设备是无法正常检查其状态,导致其依旧根据静态就近性返回访问发起方所在运营商所指向的外网IP。
解决方案: ①分别建立针对两条线路的节点监视器,【应用负载】---【节点监视器】,【新建】 ②分别新增检查项PING、CONNECT(TCP),其中检测IP设置为客户公网IP的网关,即运营商链路对端地址
ping_联通
ping_电信
connect(tcp)_联通
connect(tcp)_电信
③在虚拟IP中重新关联针对每个运营商链路所建立的【节点监视器】,即在虚拟IP设置时选择【独立】
④此时,我们所看到的链路状态才算是真实的链路状态了
验证:手动将电信出口线路拔掉,然后在电信网络下终端测试效果,得到正常反馈。即电信线路故障后,设备检测链路故障,返回解析结果时,优先返回正常链路所在的公网IP,ERP系统依旧 可正常访问,问题解决!
━◆━━∞━━◆━━∞━━◆━━∞━━◆━━∞━━◆━━∞━━◆━━∞━━◆━━∞━━◆━━∞━━◆━━∞━━◆━━∞━━◆━━∞━━◆━PS:不知道大家平时有么有注意,我是一直忽略了,尽管AD设备实施的比较少。
|