提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

基础排查-步骤一:查看应用的切换条件配置

|

问题描述

集群应用组切换,大部分是因为触发了切换条件导致切换。

有效排查步骤

1、先进入应用组管理,查看应用组的状态主要了解生效设备和首选备份设备。生效设备是指当前这个应用组生效在哪台设备上。首选备份设备,是指下次切换的话切换的目标设备。

2、进入应用组配置查看应用配置的切换条件,并记录或者记住,什么样的异常会触发应用组切换。
对象
对象是指切换可选的条件,包括链路和节点池。
全部对象故障时切换
选择这个的时候,选到左边的条件必须全部故障,应用组才会切换,比如上面需要联通线路和222的节点池还有238的节点池都故障了才会切换
任意x个对象故障时切换
选择这个的时候,如果配置的x是1,表示左边的条件任意一个出现故障,应用组就会切换,比如上面联通线路和222的节点池还有238的节点池,任意一个出现故障就会切换
自定义生效规则
这个可以自由组合切换的条件故障,可以单独节点或者单独链路,也可以是链路和节点池组合故障的时候切换,这个需要进去看具体选择的是什么。

按设备优先级切换
应用组业务发送故障的时候,切换设备会按照上面配置的设备优先级列好选择新的生效设备和备份设备。
启用设备抢占
在设备优先级列表优先级最高的设备,如果从故障恢复到监控状态就会抢占成为生效设备。

在按设备优先级切换和启用设备抢占同时启用的时候,比如 a b c 三台设备, a b 选到了优先级列表里面里面,a在前面(越前面的优先级越高)。如果a上切换条件故障了,就切换到b,如果a后面恢复了,会抢占到a。

解决方案

熟悉客户的应用组切换条件配置以后,心里大概有个概念,一些什么东西出现故障,会导致设备应用组出现什么样的动作,接下来就是去分析日志进行佐证。

我要分享
文档编号: 221895
作者: admin
更新时间: 2023-05-05 11:49
适用版本: