【天逸出品】【第六十四期】探寻SCP的容灾能力
  

常鸿 9035

{{ttag.title}}
本帖最后由 常鸿 于 2023-11-10 14:03 编辑


咱们SCP上有这样一个授权,异地容灾aDR
如果客户的私有云上的业务很重要,并且随时要提供服务,像是医院、银行等这种机构,很有必要创建一个灾备机房
然后容灾这个功能已经成了刚需
最近正好有个测试,研究了一下咱们的异地容灾这个功能

首先,主机房和容灾机房的网络建设,拓扑大致如下:



容灾(Disaster Tolerance),就是在自然灾害、设备故障、人为操作破坏等的灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统的业务不间断地运行。

咱们的容灾功能,首先要明确的是,容灾过程全程需要人为干预,当主机房出现问题时候,需要手动操作,拉起备机房的虚拟机,包括最后业务回迁,都是手动来执行的。
如果想实现自动切换,可以用延伸集群,这里不过多介绍

配置过程
首先你要有两个HCI集群,然后两套SCP

SCP需要是主备部署的,备SCP处于待机状态,如果主SCP一旦挂掉,需要手动拉起备SCP

然后网络架构上面,需要多规划一个容灾网口,平时用来传输CDP的数据,为了不挤压业务数据,最好单独规划网口和网络

容灾策略创建是很简单的

大概过程就是 选择需要的RPO ,然后选择 本地和异地的CDP备份位置
再创建一下恢复策略,选择一些需要容灾的虚拟机
策略配置完成以后,首次会进行全量备份的传输,备份传输完毕以后,就进入一个CDP同时写入的状态,也是正式到了容灾保护的阶段

如果有监控大屏,咱们还有个投屏的功能,界面是比较好看的



容灾有两种恢复模式,一个是计划内,一个是灾难后
简单介绍一下两个过程的适用场景

第一种计划内
这种情况,加入主机房要整体搬迁,或者机房要停电维护,然后业务和数据可以找个数据量小的时间点,进行切换到容灾集群,这个切换时间很快,是秒级的

容灾流程大概是这样
SCP进行备集群业务恢复——主机群虚拟机关机——备集群虚拟机拉起(数据不会丢失,但是会短暂业务断开)——备集群虚拟机支撑业务,产生新数据——主机群恢复上线(业务虚拟机关机状态)——业务回迁(增量数据回拷)——备集群虚拟机关机(手动关机)——从业务回迁开始到关闭备集群虚拟机这段时间段的新增数据迁移——主集群虚拟机上线支撑业务


第二种是灾难后

这个情况就是主机房非人为原因,产生了业务宕机,这个就需要手动进行业务拉起,这个过程肯定是已经业务停止了,需要紧急救援

容灾流程整体差不多
如果SCP备机是运行在容灾集群里,那么第一步就是唤醒备机房SCP,大概需要个5-10分钟,然后再进行容灾流程

这个需要按照主机房的情况,如果只是断电这种情况,恢复电力了,原有数据还在,那么回迁的时候就只进行增量数据的迁移
但是如果是火灾,地震,主机房已经死透了,那么机房重建以后,就是一个全量复制的过程了


回迁是会有影响业务的时间的
影响时间,跟业务的增量数据频率和大小有关系,建议在凌晨这种业务不密集的时间段来进行

我这边实际做了一次容灾演练,用客户的一台数据库为源虚拟机
先主机群宕机,然后容灾到了备集群
在备集群写入了大概40G 的数据
然后开始主机群上线,开始回迁,回迁时候对数据库进行插入操作,每秒800+条的数据写入动作

我配置的CDP策略是5秒记录一次IO数据

最后回迁完成了,业务停机时间是4分钟,丢失的数据 大概是4.4秒的数据库插入数据

演示完成汇报以后,客户对咱们的容灾能力,还是很认可的

打赏鼓励作者,期待更多好文!

打赏
4人已打赏

ggbang 发表于 2023-11-10 13:48
  
学到了学到了
李会斌 发表于 2023-11-10 16:04
  
6666666666666666666666666
南昌办_周聪 发表于 2023-11-10 17:17
  
666666666666666666
山东_陈文龙 发表于 2023-11-14 20:49
  

感谢分享有助于工资和学习!
山东_王明航 发表于 2023-12-1 16:18
  
感谢分享有助于工资和学习!
新手378833 发表于 2023-12-12 08:43
  
每天坚持打卡学习签到!!
新手716814 发表于 2024-1-5 09:47
  
有配置的相关截图就更好了。
李润东 发表于 2024-1-16 08:52
  
新手626351 发表于 2024-2-5 12:44
  
66666666666666
发表新帖
热门标签
全部标签>
有一说一
新版本体验
设备维护
安装部署配置
山东区技术晨报
每日一问
虚拟机
功能体验
解决方案
排障笔记本
纪元平台
测试报告
授权
技术盲盒
2024年技术争霸赛
问题分析处理
标准化排查
GIF动图学习
原创分享
资源访问
齐鲁TV
云化安全能力
信服课堂视频
日志审计
每日一记
sangfor周刊
地址转换
玩转零信任
「智能机器人」
场景专题
2025年技术争霸赛
专家问答
技术圆桌
升级
升级&主动服务
VMware替换
产品连连看
畅聊IT
上网策略
运维工具
用户认证
信服故事
平台使用
每周精选
排障那些事
西北区每日一问
高手请过招
高频问题集锦
全能先锋系列
安全攻防
华北区交付直播
专家说
产品知识周周练
技术笔记
SDP百科
北京区每日一练
故障笔记
社区新周刊
行业实践
流量管理
安全效果
产品动态
技术顾问
答题自测
在线直播
MVP
VPN 对接
项目案例
存储
产品预警公告
技术争霸赛
追光者计划
2023技术争霸赛专题
技术晨报
关键解决方案
声音值千金
网络基础知识
功能咨询
卧龙计划
华北区拉练
【 社区to talk】
工具体验官
终端接入
迁移
秒懂零信任
POC测试案例
专家分享
S豆商城资讯
天逸直播
SANGFOR资讯
以战代练
文档捉虫
产品解析
产品体验官
热门活动

本版版主

13
6
2

发帖

粉丝

关注

本版达人