问题描述: 1、三台主机组建集群,管理口接同一个交换机,登录集群IP后,显示主机离线。 客户背景:客户网络管控严格,交换机策略默认是全拒绝,需要什么流量通信,告诉客户具体的源目IP和协议,客户进行放通。上架实施之前,就已经告诉客户,需要放通组播流量,并且关闭组播抑制和广播抑制,集群组建依赖于组播通信。客户已经放通了224.0.0.0/4的组播流量,但集群还是无法正常组建。 排查步骤: 1、首先是检查三台主机是否可以ping通。经测试,三台主机可以互相ping通。 2、检查组播通信是否正常: (1)登录后台使用chping命令,ping其他主机时,无法ping通。 (2)使用tcpdump -i eth0 net 224.0.0.0/4 -s0 -nnev和tcpdump -i eth0 host x.x.x.x and net 224.0.0.0/4 -nnev命令抓包发现收不到其他主机发过来的组播包。 3、排查发现组播不通时,跟客户沟通,客户工程师已经放通了组播流量,当晚无业务流量时,客户把交换机策略改成了全放通,此时集群可以正常组建。但是仅放通组播流量集群无法正常建立,于是推断出,组建集群,除了组播流量,还需要放通其他的流量。 4、内部找了华为交换机经过测试,不仅要放通组播流量,还需要放通三层广播流量,集群才能正常组建。 5、客户交换机放通255.255.255.255三层广播流量后,集群状态正常。 6、以下是最佳配置命令: 255.255.255.255 代表三层广播流量 200.201.80.X 表示集群IP 172.23.6.12 PC终端IP 结论: 1、集群组建,不仅要放通组播流量,而且还要放通三层广播流量。 |