提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

一、问题概述:双机主备无法建立的可能原因和排查思路概述

|

问题描述

该场景适用于双机建立不成功,双机状态报错,双机切换不成功等双机故障场景排障

原理:防火墙双机配置完成后,会对加入监视口的接口生成虚拟MAC,而主机会使用此虚拟MAC与对端通信,备机加入监视口的接口不收发包,以此避免IP冲突引起的网络故障

告警信息

一、环境问题
1、心跳口未直连,中间过了其他网络设备
//心跳口非直连环境容易导致心跳探测超时导致双机异常

二、配置问题
总览双机状态或者【高可用性】-【双机热备】中双机状态有出现感叹号,通常鼠标移动上去会显示详细的告警原因,常见的几种告警有:
1、双机硬件适配性不一致告警
//校验cpu核数、内存大小、磁盘大小、网口数量是否一致,上述条件需要一致才可以组建双机
2、软件版本不一致告警
//双方的版本需要一模一样,打包的顺序不一致也会导致此告警
3、规则库版本/序列号不一致告警
//校验规则库版本以及朱主备机所开的授权规格是否完全一致
4、虚拟路由组配置不一致告警
//双机热备中会配置监视口,请检查监视口配置是否完全一致,常见为主机配置了一个组包含两个接口,备机配置了两个组分别包含一个接口
5、心跳故障告警
//检查心跳口是否正常接线,是否互ping正常,若配置了辅心跳线,也需要保障辅心跳线通信正常
6、接口引用了链路故障检测,故障检测不通
7、新架构默认有300s的切换冷却时间,在300s内不会发生双机切换(即是开了抢占)

三、产品问题
1、双机进程故障导致双机异常

有效排查步骤

1、检查防火墙主备状态是否正常,若有一方是故障状态,则无法进行双机切换
2、若双机状态正常:一主一备,但是有报错,则检查防火墙双机状态告警类型进行问题解决:
①硬件适配性不一致:首先获取设备SN码或者网关ID查询主备机设备型号,确认型号一致的情况下进入两台设备后台检查CPU、内存、磁盘大小、网口数量等信息是否一致。
②软件版本不一致:设备控制台【总览】-【系统状态】光标停在系统信息上查看两台设备具体的版本信息
③规则库版本/序列号不一致告警【系统】-【通用配置】-【授权管理】中对比两台设备的功能授权情况是否一致,安全能力更新中对比规则库版本是否不一致
④虚拟路由组配置不一致检查【高可用性】-【双机热备】中虚拟组、监视网口等配置是否一致;
⑤心跳故障:排查心跳口是否正常,可以在【高可用性】-【基础信息】中进行ping检测
⑥检测接口上是否引用链路故障检测,确认检测是否正常

解决方案

详细排障步骤讲解请参考下一页
豁豁哟 发表于 2022-9-16 20:26
  
楼主分享的案例很实用,具有典型性,希望有更多这样的干货供我们学习参考,非常感谢!
哇哈哈哈哈哈 发表于 2023-4-14 16:20
  

楼主分享的案例很实用,具有典型性,希望有更多这样的干货供我们学习参考,非常感谢!

新手412998 发表于 2024-4-25 09:27
  

楼主分享的案例很实用,具有典型性,希望有更多这样的干货供我们学习参考,非常感谢!

我要分享
文档编号: 222085
作者: admin
更新时间: 2023-05-25 15:22
适用版本: