本帖最后由 cs_vteam666 于 2017-11-20 16:08 编辑
一、问题现象 虚拟机备份或恢复失败
二、虚拟机备份简单规则
限制备份任务的主要有两个因素主机和存储,一个虚拟机在备份视为一个备份任务;5.2版本一个主机同时只允许有1个备份任务,整个集群内的同时备份的任务为主机数。5.3版本一台主机备份任务可以有2个备份任务,整个集群内的同时备份的任务为主机数的二倍。存储根据性能同时支持的备份任务不同,如果主机比较多备份存储只有1个,这个存储支持的个数就是最大值,以上只是简单介绍,影响备份的因素还有很多如果虚拟机运行位置、是否有迁移任务等等
备份时间到了,还有一个备份任务,则继续执行完成这个任务,下次备份则从上次还没有备份的虚拟机开始备份。
备份失败大部分是存储问题导致,因此需要重点排查存储 三、问题场景/模块排查思维导图
四、排查步骤 场景1:源和目的同存储备份失败或没有备份 【标准化排查步骤】
1、查看控制台日志,重点查看告警日志,查看一下有没有报存储异常的日志, 如果是虚拟存储,查看是否有磁盘错误,磁盘错误找400确认是否可以返修, 查看有没有存储私网是否有丢包,若有丢包换一下网线、换一下交换机网口、换一下服务器的网口 查看存储私网的网口不是协商成了百兆 2、查看存储是否异常 主要看存储是否占满 控制上测试一下磁盘的io速度,是不是io速度较低,(一块企业级硬盘测试数据块1M速度在80M/s左右)如果存 储io速度低过低,检测存储 3、查看存储连接是否异常 外置存储要看一下是否掉线的日志,看一下存储端是否有异常日志 4、没有备份,备份数较多还没轮到该虚拟机,请等待一个备份周期
场景2:源和目的不同存储备份失败或没有备份 【标准化排查步骤】 1、查看控制台日志提示 这类问题要关注两个存储的日志,同上 2、查看存储连接是否异常 这个重点说一下windows共享目录做为备份存储,这种不是专业的存储,因此稳定性比较查,遇到几个连接状态正常,但是速度很低,重启windows就能恢复,遇到这类问题先测试存储速度。从稳定性来考虑也不建议用这类做备份存储。 4、没有备份,备份数较多还没轮到该虚拟机,请等待一个备份周期
五、按照标准化排查后,找深信服技术支持建议内容包含如下信息:
1、版本信息
2、问题现象截图
3、排查结果
|