两台超融合组建集群故障迁移机制
  

王宾_安徽办_技术支持 6094

{{ttag.title}}
两台超融合组建集群故障迁移机制

场景:
两台主机组建了超融合集群,在不同网口掉线的情况下,某公司超融合平台怎样保证业务的高可用性或者是数据的一致性

1单一情况
1.1存储通信口掉线
两台超融合一体机组建集群,拔掉其中一台主机的存储通信口,虚拟机是不会迁移的(总部专家说,现在故障探测IP已经没有多少作用了,所以在两台主机的情况下,是可以将两台主机的存储通信口直连的


虚拟机的存储位置是同时在两台主机上,也就是它的存储未掉线,也就不满足存储掉线的迁移的条件,所以不进行迁移


而当存储网络恢复之后,虚拟机在之前存储掉线的主机上产生的数据,会自动同步到另外一台主机上去。

1.2管理口掉线
如果单纯拔掉管理口,虚拟机也是不会发生迁移的,因为此时不满足迁移的条件


1.3业务口掉线
如果将虚拟机的业务口拔掉
虚拟机会自动迁移到健康的主机上去运行,这个昨天已经在汇英测试过,是没问题的,同时,拔掉业务口也可以模拟主机宕机的情况。

1.4外置存储掉线
如果使用了外置存储,某台主机的外置存储掉线后,虚拟机会自动发生迁移的,因为此时虚拟机无法访问到它的存储了,满足迁移的条件


2复合情况
2.1 外置存储+管理口掉线
通过如下方法避免脑裂导致写入错误的数据
故障处理机制:

虚拟机恢复机制:



2.2 存储通信口+管理口掉线
如果是两台主机组建集群的情况下,就会发生脑裂,
当脑裂发生了,并且网络恢复后,修复程序通过仲裁IP选源,保留最近没掉线的VM,选其作为源进行修复,并将其他虚拟机实例关闭,因此可能会出现数据丢失(因为最近没掉线的虚拟机写入的数据并不一定是全部的数据,在脑裂期间,其它主机上启动的相同虚拟机有可能有数据没有写入)
针对这种情况,建议业务口和管理口复用这时候如果
1、管理口掉线,那么业务口自然也是掉线的,这时候用户就无法向掉线的主机上的虚拟机写入数据了,而只有管理口还在线的主机上的虚拟机可以写入数据。

2、而当网络恢复之后,根据如下原则:

所以集群自然会选择没有掉线的主机作为源来进行修复。
通过上面的方式,就可以避免了数据不一致性。



两台超融合组建集群故障迁移机制.doc

487 KB, 下载次数: 97

打赏鼓励作者,期待更多好文!

打赏
2人已打赏

Sangfor_闪电回_朱丽 发表于 2017-7-12 16:29
  
涨知识哦,对超融合感兴趣的小伙伴们,学习起来!
站在街头挖鼻孔 发表于 2017-7-15 22:12
  
非常感谢楼主分享
xajhmw 发表于 2017-7-16 15:46
  
涨知识了,谢谢!
詹柱美 发表于 2017-7-16 23:21
  

涨知识了,谢谢!
永远相随的人 发表于 2017-7-21 08:56
  
楼主最帅
北方翱翔 发表于 2018-3-8 12:05
  
受益了 多谢分析 最近在学习云方面的知识
78465 发表于 2018-3-8 19:27
  

非常感谢楼主分享
蓝海 发表于 2019-4-11 09:23
  
谢谢分享
秋水伊人 发表于 2019-4-11 09:24
  
谢谢分享
发表新帖
热门标签
全部标签>
每日一问
技术笔记
功能体验
技术咨询
新版本体验
2023技术争霸赛专题
干货满满
技术盲盒
标准化排查
产品连连看
GIF动图学习
技术晨报
信服课堂视频
安装部署配置
运维工具
深信服技术支持平台
秒懂零信任
自助服务平台操作指引
答题自测
安全攻防
每日一记
用户认证
通用技术
云计算知识
SDP百科
畅聊IT
sangfor周刊
资源访问
排障笔记本
专家问答
技术圆桌
在线直播
MVP
网络基础知识
升级
上网策略
测试报告
日志审计
问题分析处理
流量管理
原创分享
解决方案
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
终端接入
授权
设备维护
迁移
地址转换
虚拟机
存储
加速技术
产品预警公告
玩转零信任
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
每周精选

本版版主

217
274
151

发帖

粉丝

关注

本版达人

皮皮虾·真

本周建议达人

郑州网络

本周分享达人

二进制网络

本周提问达人