分享一下在项目中的遇到的故障。
背景:客户新部署的EDS,机房停电后EDS再次上线后,查看集群发现存储外网异常,查看发现是存储外网的私网地址ip有一部分丢失,五台主机只有两台IP还在,此时从外部ping虚拟ip池中的地址,也只有两个地址能通虚拟ip的主机。 处理过程:排查的时候开始认为可能是存储外网ip冲突导致丢失,修改外网ip后,集群主机间可以互相ping通,但外部仍然只能通虚拟ip池中的两个地址,也就是说虚拟ip没有发生漂移。 联系大佬排查后,把虚拟ip池中的ip挨个改成其他任意一个地址,保存后,再改回去原来规划的地址,也就是把虚拟池中的ip全部更新重配一遍。再次测试,发现外部访问虚拟ip池中的地址都可以通了。 分析原因:物理ip之前没挂上,导致虚拟ip没了,策略路由会因为没有对应ip而自动消除。现在ip挂上了,但没有触发虚拟ip漂移,所以没有自动添加规则。 最后:故障虽然排除了,但是其中的原因还不是理解的很深入,有大佬对此有深入理解的,欢迎指点! |