×

【HCI】虚拟机跨集群迁移,任务进度卡死95%
  

99628 547

{{ttag.title}}
一、问题现象描述
       HCI(6.7.0R3)跨集群迁移到HCI(6.8.0R2),迁移任务进度卡在95%无法继续。
二、影响及范围
       业务无影响,任务进度卡死,影响客户正常工作进度。
三、问题处置过程
       1.查看超融合对应时间点报错,任务已进行两日且始终保持该进度,共迁移五台四台成功一台异常。
       2.查看详情发现,脏数据量一直增加,减小又增加;判断此现象为内存变化率过大且高于管理口的带宽导致,迁移始终无法成功,只能等待或者通过切断业务强行切换。
       3.进入HCI后台进入对应虚拟机运行的主机,然后进入容器  container_exec -n asv-controller
       4.在虚拟机运行的主机上(即源端),进入虚拟机qmp命令行模式:
           qm monitor [vmid]
           使用info migrate命令查看迁移状态:
           info migrate,反复执行这个命令查看
       5.在qmp命令行模式migrate_set_speed 8G 把网络改大(不影响业务)
       6.使用migrate_set_downtime设置允许中断时间【业务会停止】进行强制切换,单位是秒:          migrate_set_downtime 100   这里设置的是中断业务100s(影响迁移的当前虚拟机的业务)
       7.操作完成后查看任务进度开始直接切换,随后切换成功,虚拟机开机状态正常。(以上后台操作均为单次生效,无需回调)
四、原因分析
       此问题原因是虚拟机内存变化率太高,大于传输的带宽就会出现这种情况,目前出现此情况只能通过等待或强制切换解决。

打赏鼓励作者,期待更多好文!

打赏
1人已打赏

原鹏程 发表于 2024-1-29 14:42
  
感谢楼主分享,努力学习中!!!!
发表新帖
热门标签
全部标签>
每日一问
2024年技术争霸赛
技术盲盒
技术笔记
干货满满
GIF动图学习
产品连连看
2023技术争霸赛专题
新版本体验
信服圈儿
技术咨询
每周精选
功能体验
标准化排查
通用技术
华北区交付直播
信服课堂视频
答题自测
流量管理
华北区拉练
技术晨报
安装部署配置
自助服务平台操作指引
场景专题
畅聊IT
技术圆桌
用户认证
排障笔记本
秒懂零信任
终端接入
玩转零信任
专家问答
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
每日一记
运维工具
云计算知识
原创分享
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
SDP百科
功能咨询
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
产品预警公告
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
北京区每日一练
故障笔记

本版版主

10
16
2

发帖

粉丝

关注

124
72
30

发帖

粉丝

关注

26
7
0

发帖

粉丝

关注

69
37
2

发帖

粉丝

关注

6
14
0

发帖

粉丝

关注

16
10
5

发帖

粉丝

关注

本版达人