提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

问题概述:虚拟机CDP备份原理和排查思路概述

|

问题描述

虚拟机cdp备份原理和排查思路概述

解决方案


模块说明:
1、 apache
        功能:所有的页面请求都会先请求到apache,然后进行相应的处理或转发
        日志文件:/sf/log/apache2/
2   vtpdamon
        功能:转发CDP相关请求至cdp-main
        日志文件:/sf/log/today/sfvt_vtpdaemon.log
3、cdp-main
        功能:CDP服务的API入口,处理查询类请求和转发耗时请求至cdp-compute
        日志文件: /sf/log/today/cdp-main.log
        说明:该服务在主控上生效
4、cdp-compute
        功能: 处理CDP相关的耗时任务请求,如基准点备份创建、恢复IO日志、删除IO日志、启动CDP
       或停止CDP等
        日志文件: /sf/log/today/cdp-compute.log
5、iolog_clean.py
        功能:按照CDP策略定义的时间和空间要求对IO日志进行清理
        日志文件: /sf/log/today/iolog_clean.log
        说明:
            只有存在CDP策略时才会进行清理
            只有虚拟机的CDP策略处于启用状态才会进行清理
            没有策略对应的虚拟机的IO日志会在没有使用的三天后移入回收站,再过三天后被清
6、 cdp-worker
        功能: IO日志数据任务执行者,从kvm中获取IO日志数据写入cds存储系统中
        日志文件: /sf/log/today/sfvt_cdp_worker.{vmid}.log,
        例如:/sf/log/13/sfvt_cdp_worker.4398424995418.log
7、cdpstor-cli
        功能:cds提供的命令行工具,提供对cds中数据的查询、删除、导出等功能
        日志文件: /sf/log/today/sfvt_cdpstor-cli.log
8、cds
        功能: 提供存储和管理IO日志数据的文件系统
9、qemu-nbd
        功能: 提供IO日志的块设备访问方式,通过其提供的块设备,可以实现快速恢复、IO日志文件
         浏览等
        日志文件: /sf/log/12/sfvt_qemu-nbd.log
10、IO日志存放位置
   路径:/sf/data/{iolog_storage_id}/backup/cdp/{vmid}/
    字段说明
        iolog_storage_id:虚拟机对应的IO日志存储的ID
        vmid: 虚拟机的ID
    文件说明

   cdp_data.bcfg: IO日志配置文件
   cdpstor: IO日志数据文件


CDP备份失败和虚拟机备份失败排查典型场景步骤可以复用,日志都相同,CDP多增加了几个相关的日志。

排查思路

1、查看页面的操作日志信息,获取任务执行节点和CDP备份失败日志具体报错
2、检查是否备份存储性能不足导致
3、检查是否基准点创建失败或者无法解析备份配置信息失败
4、检查CDP备份相关日志是否存在异常的报错信息

信息确认:故障现象关键信息确认
1、故障现象描述:
2、故障发生时间:
3、故障影响范围:单个虚拟机还是所有虚拟机备份
4、故障前做过的操作:是否有对虚拟机或者平台做过变更
5、设备详细版本信息:平台详细版本信息
解释:此部分内容面向外部客户(适配L1、渠道、客户),需要外部提供的信息,内部L1层级保障能够将这部分信息收集全面好准确;

操作影响范围

我要分享
文档编号: 219839
作者: admin
更新时间: 2023-01-05 17:29
适用版本: