对于业务数据出现的故障(发生在虚拟机内部的故障,如虚拟机内误删数据、勒索病毒),仅仅依赖业务服务器自身的可靠性建设(存储双活、多副本、HA、系统故障自动重启)是无法避免的,因为这类故障将直接损坏数据源,进而对副本数据也造成数据损坏。比如,近来疯狂的勒索病毒,会导致业务系统内部的数据自身遭到破坏,即便采用多副本,其每个副本数据都会被破坏。 针对此类故障,超融合平台提供快速备份机制来应对。技术上采用首次全量备份+非首次增量备份+bitmap技术(bitmap的方式标记了QCOW2文件的变化的位置,也称脏数据位置)实现快速备份,下面将详细介绍快速备份的实现原理: 对虚拟机进行备份时,首先进行全量备份(如果已经有全量备份则直接进行增量备份)。 全量备份后业务持续写入新数据(G和H),用bitmap标记,此时新数据可以在QCOW2文件的原位置直接写入,下次备份时只增量备份修改处的数据;备份结束后重新将bitmap置0,以此进行每一次的备份操作。在原位置写入新数据时可直接写入,不会发生写时拷贝,不会造成QCOW2文件与数据位置的映射乱序,因此不会对QCOW2镜像造成任何性能上的影响;增量备份方式减少每次备份的数据量,进而提高备份速度。 删除增备文件,数据向后合并,保证每个保留的备份数据都是完整可用的,以此快速释放空间,节约备份存储资源。
当一个虚拟机的多个磁盘镜像、或者多个虚拟机的磁盘镜像有相关性时,快速备份还提供多磁盘数据一致性检查,比如在数据库的应用场景中,数据库(SQLServer, Oracle)的数据盘、日志盘,必须保持备份时刻的一致性,否则当恢复备份时,会由于不一致导致恢复的Oracle系统仍然不可用,而通过深信服的快速备份可保障数据库数据的多个磁盘在恢复时,保持数据的一致性。
在超融合平台上备份操作非常简单: 通过向导四步即能新增一个符合用户业务特征的备份策略。 支持按周、按天、按小时的自动备份周期,根据实际业务需求灵活配置。同时提供自动清理备份功能,最大限度节省备份存储空间。此外无须安装插件,简单易用。
从上图可以看到,快速备份在首次全量备份、第二次增量备份的过程中,原始基于QCOW2的备份只出现少许性能下降,而在备份结束后,即迅速恢复到了初始水平。
备份文件清理策略: 客户可以根据业务情况自定义备份文件保留策略,时间粒度从天到年,相较之前保留策略更加灵活。 |