面对数据中心五连杀,你的业务稳了吗?
  

Sangfor_云计算 3182

{{ttag.title}}
本帖最后由 Sangfor_云计算 于 2018-11-22 14:58 编辑

面对数据中心五连杀,你的业务稳了吗?
生活就像一盒巧克力,
你永远不知道下一颗是什么味道。
这句经典台词折射的道理,
同样存在于信息化世界里,
就像你永远不知道
下次爆发数据中心故障是哪一天。

First blood
201710月,某IDC服务商机房电力负载过高,造成配电柜开关跳闸,供电中断,空调停止运行,生产机房温度升高,设备宕机,并直接导致某某公司业务中断。
Double kill
2018224日,某省某公司服务器中招勒索病毒,导致全院所有医疗系统均无法正常使用,造成严重的经济损失和负面影响。
Triple kill
20185月,某某公司核心系统数据库发生故障,数据库自动存储管理(ASM)文件异常损坏。由于使用的是存储复制双活,损坏数据也被同步到备数据中心,导致备数据中心也无法使用,造成柜台业务长时间中断。
Quadra kill
20189月,某物流公司一名高级运维工程师由于一时疏忽,误删除数据库,对线上发车业务造成长达10小时的停摆,造成众多快递件延迟签收。
Penta kill
201810月,某科技公司由于100G光设备出故障,导致数据中心网络断开,进而造成该公司24小时又11分钟的服务中断。
机房断电、勒索病毒、存储故障、误删除、网络故障,面对数据中心常见五杀场景,没做备份也没做容灾、做了备份但没做容灾、传统做了备份也做了容灾的用户们,似乎都遇到了相同的问题,即业务无可靠性保障带来的措手不及

数字经济时代,用户对业务系统的可靠性、稳定性提出更高要求。综上案例所述,业务系统容灾备份就好比买商业保险一样,已经逐渐被认同和重视。核心业务系统一旦出现故障,将给企业带来严重的负面影响甚至灾难性后果。那么如何选择一套完善的容灾备份方案?这个问题就摆在了用户面前。只做备份不做容灾不行,只做存储双活也不行,不做备份不做容灾更不行,只有基于业务层面的整体容灾备份方案才是最可靠的。

即使容灾做了全套,但新的问题随之而来:一是容灾方案的实施及维护问题,大公司一般都有较专业的运维人员,而很多中小型企业,并没有专业的运维人员。二是传统的容灾备份需要不断购买存储设备,价格昂贵,成本是个问题。

某公司四大容灾方案,简单易用、高性价比
在这样一个背景下,某公司超融合企业级云为用户打造了四大简单易用、高性价比的容灾整体解决方案,在企业做IT架构转型的过程中,为用户的业务系统全面保驾护航。
1. 远距离跨城容灾
某公司远距离跨城容灾方案,使用互联网+VPN的窄带(20-30M)连接两个数据中心,存在10ms~50ms的延迟,丢包5%左右。当主数据中心出现故障或是业务不可恢复的情况下,直接在备数据中心进行业务拉起,保证业务持续可用。
2.短距离同城容灾
某公司短距离同城容灾方案,使用光纤打通或者使用波分复用设备连接两个数据中心;10G光纤直连,低延迟1ms,基本无丢包。当主数据中心出现故障或是业务不可恢复的情况下,直接在备数据中心进行业务拉起,保证业务持续可用。
3.跨机房园区级容灾
某公司跨机房园区级容灾方案,适用于多数据中心且在不同楼之间,数据中心之间使用光纤打通;10G光纤直连,低延迟1ms,基本无丢包。当主数据中心出现故障或是业务不可恢复的情况下,直接在备数据中心进行业务拉起,保证业务持续可用。
4.双活数据中心
某公司双活数据中心方案适用于对业务稳定性要求非常高的银行或是企业。2个数据中心都承载业务,通过Oracle RAC实现数据库的双活,延时控制在1ms2个数据中心各放一个数据库节点,当任意数据中心出现故障,不影响另外一个节点的业务,从而实现业务的双活。底层通过某公司企业级云平台的拉伸集群方式实现数据的同步。
各种RTO,RPO容灾指标全面满足
RT0=0分钟,RP0=0:
针对对RTORPO要求非常高的用户,某公司设计了拉伸集群+DG的双活方案 ,底层的2副本机制从原理上保证任意的主机故障和磁盘故障,都不会导致数据的丢失。对于数据库层面出现的逻辑错误,比如:误删除数据、数据落地错误导致的数据文件损坏情况,某公司开发了全自动化部署的DG工具,针对核心Oracle业务做3+1容灾部署,保证在RAC节点数据出现损坏的情况下,DG节点可以零延时承载核心业务。


RT0 < 2分钟,RPO~=0
预算有限、无法采购高成本的双活架构,来实现业务高可靠性,对于业务的短暂停机是可以接受的。针对这一类型的用户,某公司结合CDP技术提供企业级云容灾方案,在备机房容灾应用系统,对于非常核心的数据库,使用数据库业务容灾方案,通过组合式的高容灾可靠性方案,实现业务RT0 < 2分钟,RPO~=0


5分钟<RT0<10分钟,RPO~=0
没有特定IT运维人员,业务系统可以接受5-10分钟的中断。针对这一类型用户,某公司提供全业务容灾方案,所有业务系统全部容灾到备数据中心,当主数据中心宕机或是不可恢复的情况下,保证在5分钟内快速拉起业务。

各种典型架构场景全面支持
场景一:生产业务部署在一套某公司企业级云aCloud环境,选择容灾到另一套aCloud平台,或者原生产业务部署在物理环境,选择某公司企业级云平台进行业务承载并进行容灾保护。
某公司企业级云平台提供本地备份-异地容灾的完整虚拟机级别灾备方案:两套aCloud平台互为灾备,通过定时备份(普通备份或CDP备份)实现本地备份数据;通过容灾模块的传输技术实时同步本地数据至异地,进而实现异地数据备份,灾难发生后可在主站点或者备站点快速恢复业务,并提供一键回迁功能,实现业务从备站点回迁到主站点。

场景二:生产业务部署在VMware环境,选择容灾到某公司企业级云平台。
某公司企业级云平台可同时管理aCloud平台和VMware平台,简化用户运维;提供VMware容灾方案,包括一键式备份、快速恢复、回迁业务,并按需扩容存储空间;通过将VMware虚拟机备份到aCloud平台,当VMware虚拟机故障时,可将备份虚拟机直接恢复到VMware vCenter中,也可直接在aCloud中快速拉起并恢复。

场景三:原业务系统是小型机(AIX),选择容灾到某公司企业级云平台。

由于小型机承载的是Oracle数据库,使用传统的DG方案无法实现持续的业务容灾。一般来说,对于小型机的容灾,只能通过选择一台同样的小型机或通过数据库导出方案,进行跨平台数据迁移到X86平台来实现。对于无法长时间停机的客户,这种容灾方式带来的业务停机时间是不可接受的。针对这种情况,某公司和英方合作,推出跨平台的数据容灾方案,控制业务停机时间在10分钟以内,很好地解决AIXX86平台的长时间业务中断问题。


场景四:原业务系统是物理环境,选择容灾到某公司企业级云平台。

某公司和ROSE深度合作,支持物理机到虚拟机的双机热备,解决了物理环境容灾到虚拟机环境。当物理机故障时,业务自动切换到容灾的虚拟化环境。当物理主机意外故障的情况下,可以在1分钟以内快速恢复业务。

场景五:原业务系统是RACAlways On集群部署,需要进行容灾部署。

某公司拥有专业的实施团队(具备DBA专业认证),可以帮助用户做RACAlways On的集群部署,扩充节点到超融合平台,保证业务无缝切换到超融合平台。


场景六:原业务系统本身软件架构上无法集群部署,需要进行容灾部署。
针对EAS银企平台核心业务,传统的HA无法实现业务的快速恢复,中断时间用户无法接受。某公司使用rosereplicator方案,可以解决单业务的高可靠性,保证业务在出现单节点故障的情况下,快速恢复。该方案已经得到了金蝶EAS总部的合作认证。


场景七:不具备容灾条件只需数据备份。

HCI超融合支持虚拟机级别的数据备份、通过CDP或虚拟机的备份,来做到数据的异地备份。只需简单的部署和规划就可以做好备份需求,不依赖于任何第三方方案和产品,真正做到简单易用。针对部分虚拟机备份个性化需求,比如:特定目录、文件备份,某公司与英方、爱数、火星高科都有深度合作,提供整体容灾备份解决方案。

写在最后
通过以上企业数据中心五杀场景介绍,是时候给关键业务系统上一道保险了,不怕一万只怕万一。只有做好充足的容灾备份方案,当出现故障时才能从容地化险为夷,确保万无一失。某公司通过多场景容灾方案打造,帮助每一位用户保障核心业务的持续稳定可靠运行。
*关于某公司容灾具体的技术细节和方案,欢迎联系当地销售或技术支持,某公司会为您提供详细的咨询和测试。
关于某公司云IT
用创新打造极简、稳定、高性能的云IT新架构,包含企业级云、桌面云、专属云“三朵云”整体解决方案,致力于为政府及企事业单位提供从桌面到数据中心、从本地到云端、从私有云到混合云完整的云计算方案与服务,为数字化转型构建稳固的基石,帮助用户解放生产力,专注业务创新。

打赏鼓励作者,期待更多好文!

打赏
2人已打赏

Janbos 发表于 2018-12-4 15:27
  
请教一下,某公司的备份能实现实时备份吗?
凡鸟末世 发表于 2018-12-4 14:30
  
非常好的资料
sailyang 发表于 2018-12-4 10:22
  

学习、学习、感谢分享
主动出击 发表于 2018-11-29 14:16
  
充电学习。
ie5000 发表于 2018-11-29 09:57
  
哈哈,前单位客户可能不稳,现单位很稳
玖零网络 发表于 2018-11-24 09:13
  
路过 学习  
发表新帖
热门标签
全部标签>
西北区每日一问
技术盲盒
每日一问
技术笔记
干货满满
GIF动图学习
通用技术
标准化排查
SDP百科
产品连连看
技术咨询
技术圆桌
社区新周刊
信服课堂视频
功能体验
2023技术争霸赛专题
秒懂零信任
自助服务平台操作指引
畅聊IT
在线直播
新版本体验
技术晨报
安装部署配置
sangfor周刊
VPN 对接
专家问答
高手请过招
升级&主动服务
答题自测
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
原创分享
解决方案
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
排障笔记本
产品预警公告
玩转零信任
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
每周精选
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记
排障那些事
高频问题集锦

本版版主

461
247
13

发帖

粉丝

关注

本版达人

feeling

本周分享达人

新手29676...

本周提问达人