深信服技术认证之容灾与备份(二)
  

xueshenw 925

{{ttag.title}}
3. 1灾难备份方案级别评定
在国际标准上,将灾难备份方案分成了7个级别,不同级别在备份/恢复的范围、灾难恢复计划的状态、应用站点与灾难备份站点之间的距离、应用站点与灾难备份站点之间是如何相互连接的、数据是怎样在两个站点之间传送的、允许有多少数据被丢失、怎样保证更新的数据在灾难备份站点被更新、灾难备份站点可以开始灾难备份工作的能力这些方面进行评定分级。

3.2 灾难备份方案级别
根据上文描述的原则,国际标准SHARE 78对容灾系统有7个层次的定义:从最基本的本地备份到异地备份,再到通过网络备份程序进行备份以及建立实时的灾备系统,实现业务的高可用性。目前针对这七个层次,都有相应的技术方案,如下是0-6共7个层次的说明:

级别        说明        使用场景特点
0级:无异地备份        数据仅在本地进行备份,没有在异地备份数据,无灾难恢复计划。        最低成本方案,但不具备真正灾难恢复能力。
1级:实现异地备份        在0级的基础上,实现备份数据的异地化存储,同样无灾难恢复计划,出现灾难后,从异地备份中取出数据,然后进行本地恢复。        业务恢复时间长,需要在异地取回备份数据。
2级:热备份站点备份        在1级的基础上,增加了灾难恢复计划,并在容灾区域放置热备系统,将从主数据中心的数据备份运输到异地后,在异地使用备份数据创建系统和服务,主数据区域故障,手动在热备系统启用。        成本投资会有增加,需要提前维护一套热备系统,可以在本地发生毁灭性灾难后,快速进行业务恢复。但是备份的数据需要运输,异地热备中心保存的数据是上一次备份的数据,可能会有几天甚至几周的数据丢失。
3级:在线数据恢复        改变了2级中异地运输备份的方式,改为了网络传输到异地,有相应灾难恢复计划,有备份中心,并配备部分数据处理系统及网络通信系统。        如有灾难发生,关键数据通过网络可迅速恢复,恢复时间明显缩短,这一等级方案由于备份站点要保持持续运行,对网络的要求较高,因此成本相应有所增加。
4级:定时数据备份        在3级方案基础上,利用备份管理软件自动通过通信网络将部分关键数据定时备份至异地,有相应的灾难恢复计划。灾难发生后,利用备份中心已有资源及异地备份数据恢复关键业务系统运行。        根据备份策略的不同,数据的丢失与恢复时间达到天或小时级。由于对备份管理软件设备和网络设备的要求较高,在备站点可以直接恢复,因此投入成本也会增加。但由于该级别备份的特点,业务恢复时间和数据的丢失量还不能满足关键行业对关键数据容灾的要求。
5级:实时数据备份        通过硬件的镜像技术和软件的数据复制技术等,实现两个存储的近乎实时的同步(同步或者异步),在灾难发生时,仅仅很小部分的数据被丢失。        恢复的时间被降低到了分钟级或秒级。由于对存储系统和数据复制软件的要求较高,所需成本也大大增加。但这些方案有一个不足之处就是异地的备份数据是处于备用(Standby)备份状态而不是实时可用的数据,这样灾难发生后需要一定时间来进行业务恢复。
6级:零数据丢失        灾难恢复中成本最高,速度最快的恢复方式,是灾难恢复的最高级别,使用专用的存储网络将关键数据同步镜像至备份中心,数据不仅在本地进行确认,而且需要在异地(备份)进行确认。所以灾难发生时异地容灾系统保留了全部的数据,实现零数据丢失。一旦发生灾难,备份站点不仅有全部的数据,而且应用可以自动接管,实现零数据丢失的备份。        采取这种容灾方式成本投入非常高,而且同步校验结果也会影响应用的性能,适用于生产交易较少或非实时交易的关键数据系统。
4.灾难备份方案实例
本章节通过虚拟化云平台功能,来描述各个级别方案的具体实现方式。

4.1 0级灾难备份方案案例
如下图所示,给一个业务系统除分配正常的硬盘以外,再额外配置一块磁盘。额外的磁盘专门用于备份使用,需要通过管理员进入到操作系统中,使用手动拷贝的方式,将业务数据,由业务盘,备份至本机的数据备份盘。



在此备份方式下,可以解决的问题场景有如下两个:

场景一: 业务盘中的数据被误删除导致丢失。在此问题下,可以通过备份盘中的数据拷贝覆盖的方式进行恢复。

场景二: 整个系统崩溃,如系统无法开机使用等,此时可以通过新建虚拟机,并挂载故障虚拟机的备份盘的方式,读取备份文件,并在虚拟机中新建应用,实现应用恢复。

无论是场景一还是场景二,由于这种数据的备份依靠管理员的手工操作,备份周期不可控,备份间隔时间会比较长,在最后一次备份完成后到出现问题的时间点,这之间的数据无备份,因此,这一段时间内,是无法恢复。另外如果出现本地灾难性毁灭问题,如机房位置出现水灾的灾难时,数据是无法实现恢复的。

4.2 1级灾难备份方案案例
如下图所示,业务系统运行于虚拟化平台上,通过手动导出的方式,进行虚拟机整体的导出操作。


将导出的虚拟机文件,运输并备份至其他的异地存储中。


在此备份方式下,可以解决的问题场景为:本云平台虚拟机中了勒索病毒,导致了业务中断,不可用,将备份的虚拟机文件从异地取回,然后进行导入恢复,实现业务的重新上线。

但是,此方案中,如果机房整体故障了,且短期不能恢复,那么会严重影响业务重新上线的时间。

4.3 2级灾难备份方案案例
通过1级备份方式,将虚拟机的备份文件导出,并运输至备站点中,但是同时在备站点中也搭建一个云平台,将导出的备份文件,每次运输完成后,就进行导入,以便主平台故障不可用时,可以有备站点接管。

如下图所示,可以将备份导出的虚拟机文件,在备站点中导入。





在此备份的方式下,可以解决的问题场景为:主站点完全故障不可用了,但是有一个备站点具备虚拟化的环境,可以将运输过去的主站点备份文件,直接在备站点上导入并生效,确保服务快速可用。

但是,由于最近一次的备份到出现故障问题的时间点中间的数据无备份,直接导致最新的数据与备份数据会存在较大的差距,会产生较多的数据丢失问题。同时,需要维护一个备站点,成本有所增加。

4.4 3级灾难备份方案案例
3级灾难备份方案通过网络将虚拟机的备文件进行传输,传输至异地的备份中心中,如下图所示,在云平台中,针对某个虚拟机,进入到备份与容灾选项中。


对虚拟机执行立即备份,即手动的备份。


将此虚拟机由本平台,通过网络备份至一个异地的平台上,实现通过网络的手动异地备份。若该虚拟机出现异常问题后,可以通过网络,将此虚拟机直接进行恢复,无需将备份文件进行线下的运输。



在此备份方式下,可以解决的问题场景为:本云平台虚拟机中了勒索病毒,导致了业务中断,不可用,可以通过在线的备份文件,通过网络直接继续恢复,无需线下运输备份文件,可以实现快速的业务上线使用。

但是这种模式下,备份存储和主数据中心的平台必须是互通的,因为需要专线等线路打通主数据中心和异地的备份站点。

4.5 4级灾难备份方案案例
4级灾难备份方案和3级一样,通过网络将虚拟机的备文件进行传输,传输至异地的备份中心中。但是在执行上和恢复上存在差异,在执行上,4级灾难备份方案可以通过策略实现定时的自动周期性备份,无需人为操作。在恢复的时候,要求备站点具备恢复的的环境,并在备站点直接进行恢复,避免主站点异常不可用导致短期业务无法快速恢复。

如下所示,可以在云平台上,针对虚拟机创建备份计划。


进行备份策略的配置。


选定需要备份的机器。


可以根据需要设置备份计划,无需人工手动触发备份,到达时间后,自动进行。在恢复的时候,可以通过将备份设备重新挂载到备数据中心的虚拟化平台上,在备站点进行直接恢复。


在此备份方式下,可以解决的问题场景为:主站点的云平台完全故障,导致了业务中断,可以通过在线的备份文件,挂载到备站点的云平台上,在备站点直接使用或者恢复。

这种模式下,备份存储和主数据中心的平台必须是互通的,与备中心的平台也需要能够通信,常规备份策略一般达到小时级,针对数据完整性更高要求的应用不适用。

4.6 5级灾难备份方案案例
5级灾难备份,通过硬件的镜像技术和软件的数据复制技术等,实现两个存储的近乎实时的同步(同步或者异步),在灾难发生时,仅仅很小部分的数据被丢失。 如下图所示,通过云平台提供的虚拟机容灾功能,将生产数据中心的业务虚拟机容灾到容灾数据数据中心一份,通过监控IO日志,实现秒级的数据传输,两个数据中心间通过数据复制专线进行数据同步。当主生产中心不可用时,切换到容灾中心进行使用,此过程备数据中心需要将虚拟机在本地拉起,整体业务影响时间为虚拟机和业务启动时间,数据丢失量几乎为0。

4.7 6级灾难备份方案案例
6级灾难备份,只依靠基础设施层是无法实现的,在云平台上,首先通过延伸集群,实现数据副本落盘在不同的机房的服务器上,实现数据的完全一致。当主机房故障了,备机房可以存在完整的数据。无状态的应用,可以部署于不同机房的云平台上,可以通过负载均衡调度,实现多活的效果。有状态应用需要通过应用本身的高可用或者集群功能,实现用户状态信息或者连接的同步,确保切换后,用户无感知,数据无丢失。

打赏鼓励作者,期待更多好文!

打赏
1人已打赏

平凡的小网工 发表于 2024-11-7 23:39
  
感谢分享灾备和容灾的相关技术,学习了。
发表新帖
热门标签
全部标签>
安全效果
每日一问
西北区每日一问
【 社区to talk】
干货满满
技术盲盒
技术笔记
产品连连看
新版本体验
技术咨询
信服课堂视频
标准化排查
每周精选
排障那些事
GIF动图学习
功能体验
技术晨报
自助服务平台操作指引
安装部署配置
运维工具
解决方案
故障笔记
技术圆桌
云计算知识
用户认证
技术顾问
资源访问
存储
「智能机器人」
2023技术争霸赛专题
通用技术
秒懂零信任
畅聊IT
答题自测
专家问答
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
原创分享
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
地址转换
虚拟机
迁移
加速技术
排障笔记本
产品预警公告
玩转零信任
信服圈儿
S豆商城资讯
技术争霸赛
追光者计划
深信服技术支持平台
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
2024年技术争霸赛
北京区每日一练
场景专题
高手请过招
升级&主动服务
高频问题集锦
社区新周刊
POC测试案例
全能先锋系列

本版热帖

本版达人