HCI主机缩容 版本:HCI6.9.0 Ø 需求背景: 客户8台超融合组建标准集群,所有主机的存储已加入虚拟存储卷,并且客户已迁移业务至超融合中正常运行,因特殊原因需要将集群中的4台主机踢出集群。 Ø 准备工作(已经踩过的坑): 1.工具aDeploy_HCI_SCP_install_3.6.7_20230627(HCI690); 2.确保待缩容主机上没有虚拟机或者虚拟设备(监控中心,安全组件等)在运行; 3.确保待缩容主机为非主控节点; 4.删除分布式交换机,将业务临时连接到对应端口组上; Ø 注意事项 1.确保缩容之后集群的资源足够支撑客户的业务运行; 2.要先迁移主机数据,一台一台缩容,时间很长; 3.每缩容完1台主机都要隔离,关机或者断网、恢复出厂; 缩容步骤: 确认缩容主机: 8台主机分别为10.0.24.180-10.0.24.187,计划缩容10.0.24.184-10.0.24.187,保留10.0.24.180-10.0.24.183 1.登录集群,在端口管理中打开集群的SSH管理; 2.检查一下虚拟机的运行位置,确保待缩容主机上没有正在运行的虚拟机,如果有的话,迁移至其他主机; 上面检查发现10.0.24.186和187主机上有虚拟机在运行,迁走迁走; 3.缩容开始前再次确认虚拟机已经全部迁移走,主机上虚拟机为空 4.打开aDeploy,开启HCI主机缩容 5.输入集群IP、用户名、密码; 6.选择缩容的主机,点下一步;进行磁盘检查 7.磁盘检查完毕,点一件缩容进行主机缩容; 等待进度条。。。。。。。。。 持续等待中。。。。。。 确实很慢。。。。。。 8.进度条跑完,输入超融合密码解除缩容主机的维护模式; 9.缩容成功!!!! 10.检查虚拟存储卷,187主机已经成功拿掉了; 11.检查实体机,187主机也已经被拿掉了; 12.将缩容主机恢复出厂设置; 过程中踩得坑: 1. 主机是卷主控,不支持删除;其中一台待缩容主机为主控节点; 解决办法:(1)先切换主控节点为其他不做缩容操作的主机; (2)将缩容主机进入一下单主机维护模式; (3)等元数据平衡任务结束后再退出单主机维护模式; (4)退出后会系统会再进行一次元数据平衡任务,等待结束后就可以进行缩容操作了; 2. 集群中存在分布式交换机; 解决办法:先临时将业务虚拟机连接至端口组,删除分布式交换机,等缩容完之后再重新建分部署分布式交换机; 3. 执行磁盘迁移命令失败; 解决办法:等,这个个人猜测可能跟集群其他后台任务有冲突,等待了一段时间后重试就可以了; |