×

【HCI】虚拟机跨集群迁移,任务进度卡死95%
  

99628 1968

{{ttag.title}}
一、问题现象描述
       HCI(6.7.0R3)跨集群迁移到HCI(6.8.0R2),迁移任务进度卡在95%无法继续。
二、影响及范围
       业务无影响,任务进度卡死,影响客户正常工作进度。
三、问题处置过程
       1.查看超融合对应时间点报错,任务已进行两日且始终保持该进度,共迁移五台四台成功一台异常。
       2.查看详情发现,脏数据量一直增加,减小又增加;判断此现象为内存变化率过大且高于管理口的带宽导致,迁移始终无法成功,只能等待或者通过切断业务强行切换。
       3.进入HCI后台进入对应虚拟机运行的主机,然后进入容器  container_exec -n asv-controller
       4.在虚拟机运行的主机上(即源端),进入虚拟机qmp命令行模式:
           qm monitor [vmid]
           使用info migrate命令查看迁移状态:
           info migrate,反复执行这个命令查看
       5.在qmp命令行模式migrate_set_speed 8G 把网络改大(不影响业务)
       6.使用migrate_set_downtime设置允许中断时间【业务会停止】进行强制切换,单位是秒:          migrate_set_downtime 100   这里设置的是中断业务100s(影响迁移的当前虚拟机的业务)
       7.操作完成后查看任务进度开始直接切换,随后切换成功,虚拟机开机状态正常。(以上后台操作均为单次生效,无需回调)
四、原因分析
       此问题原因是虚拟机内存变化率太高,大于传输的带宽就会出现这种情况,目前出现此情况只能通过等待或强制切换解决。

打赏鼓励作者,期待更多好文!

打赏
1人已打赏

原鹏程 发表于 2024-1-29 14:42
  
感谢楼主分享,努力学习中!!!!
发表新帖
热门标签
全部标签>
2025年技术争霸赛
新版本体验
每日一问
标准化排查
GIF动图学习
高手请过招
功能体验
纪元平台
信服课堂视频
产品连连看
运维工具
技术笔记
安装部署配置
秒懂零信任
故障笔记
【 社区to talk】
技术圆桌
VPN 对接
排障笔记本
玩转零信任
技术盲盒
每周精选
排障那些事
社区新周刊
畅聊IT
答题自测
专家问答
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
用户认证
原创分享
解决方案
sangfor周刊
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
产品预警公告
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
2023技术争霸赛专题
卧龙计划
华北区拉练
天逸直播
以战代练
技术晨报
平台使用
山东区技术晨报
文档捉虫
齐鲁TV
华北区交付直播
2024年技术争霸赛
北京区每日一练
场景专题
西北区每日一问
升级&主动服务
高频问题集锦
POC测试案例
全能先锋系列
安全效果
云化安全能力
专家说
热门活动
产品动态
行业实践
产品解析
关键解决方案

本版版主

124
74
30

发帖

粉丝

关注

26
9
0

发帖

粉丝

关注

70
37
1

发帖

粉丝

关注

本版达人