一.实施前准备
1.提前制作好桌面云启动U盘(社区下载对应桌面云系统镜像,通过UltraISO等工具将镜像烧录至U盘即可)
2.协调400工程师进入后台备份网口配置(图1.1)以及一体机签名(一体机重装系统大概率出现网口乱序,导入好提前备份的网口信息可解决.图1.2)
路径:/boot/boot/net 路径:/boot/firmware/conf/vs/
图1.1 图1.2
ps:管理口做了聚合的话,最好备份下管理聚合口的mac地址 做到有备无患,在VMP5.4.5版本中可能会出现“恢复主机(x.x.x.x)网口mac地址与被恢复主机不一致”这种情况出现的话,后台重新修改管理聚合口的mac即可解决(图1.3).
3.准备好集群补丁包,主机替换好系统盘后需要打上集群补丁包,有些包找不到可以找人工获取(管理--设备升级可看到对应补丁包信息.图1.4)
(图1.4)
4.通过巡检工具或者后台运行命令检测副本完整性,全部显示为0副本正常 显示1异常,需要协调400进行处理(图1.5)。
命令:vs_cluster_cmd.she '/sf/vs/bin/vs_localhost_checkok.js check_all; echo $?'
(图1.5)
5.查看替换系统盘主机是否为主控以及授权KEY是否插在主机上,如果是 需要切换其它主机为主控以及将key拔插至其它主机上(图1.6)
(图1.6)
6.查看网口配置信息 并截图保存好.
7.迁移替换主机虚拟机至其它主机运行(图1.7),这样可以不影响业务;集群资源不足的情况下,关闭单台主机虚拟机也可以进行操作,后者影响一部分虚拟机前提与客户沟通好.
(图1.7)
二.实施更换
1.检查好集群无数据同步任务,替换主机无虚拟机运行后 将主机暂停服务(图2.1)。
(图2.1)
2.将主机关机,替换新的SSD系统盘并装好系统(一体机发过来的SSD系统盘一般都有系统,无需重装),主机安装好系统盘系统运行起来后,检测一体机签名是否丢失以及进入平台检查网口是否正常,网口乱序了的话可以导入先前备份好的网口配置进行解决;或者通过桌面云工具进行网口排序(个人更推荐直接导入网口备份 省时省力)
3.对主机进行补丁升级,升级至与替换前一致的补丁信息。
(图2.2)
4.安装好补丁后,配置好管理口IP以及聚合口(管理口IP,以及管理 业务 存储口聚合)并接好对应线.
5.登录集群,点击对应主机选择重建系统盘,点击下一步,系统根据主机硬件信息,自动匹配主机系统配置,点击校验主机,输入密码之后,点击完成,系统自动同步主机配置(配置同步好后,检查业务口 虚拟交换机配置是否正常),并将主机启动服务(点击主机-启动服务,未启动是灰色图标)图2.3
(图2.3) 6.检查数据同步任务,存储-数据同步和平衡任务执行状态,等待无数据同步任务后,检查副本一致性(图2.4)。
(图2.4)
7.检测业务是否正常。集群一键检测或跑下桌面云巡检工具;登录VDI 连接虚拟机是否正常,无异常后完成替换操作.
总结:本次替换操作有几个点需要额外注意下
1.系统盘是否需要做raid,有些老桌面云一体机系统盘是插在服务器后面的 这种是做不了raid的,后置的盘位raid卡检测不到;如需做raid需要额外添加一张raid卡.(如下图,我是两个480G的系统盘 先前准备做raid1 发现raid卡识别不到)
2.重装系统后,网口乱序的问题,这个可以通过点亮主机网口去测试是否乱序。
3.低版本的桌面云可能出现管理聚合口mac报错的问题。
4.如果有好几台桌面云需要替换系统盘,只能一台台去做替换操作,桌面云存储默认是双副本,如果两台及以上主机无法提供服务,就会导致用户在登录时出现虚拟机丢失的情况。所以必须保证集群内的主机最多只能一台暂停服务。
5.替换一台主机大概两个小时左右,时间允许的情况下 建议停机时间协调长一点 以备不时之需。
6.替换主机打好补丁后,原来做了聚合的接口 需要手动去创建好聚合口
实施前准备充分,希望大家交付时少踩坑。
以上就是本次我替换实施的步骤以及需要注意的地方,有不足的地方希望大家可以指出来 相互学习共同进步。