桌面云系统盘替换实战
  

haibin 1476

{{ttag.title}}
本帖最后由 haibin 于 2023-12-11 11:32 编辑

          背景:给客户设备定期巡检过程中,发现有一台桌面云系统盘寿命很低 达到返修要求。由于是桌面云一体机老服务器,原机器系统盘没有做raid1,在收到厂家发来的新硬盘后,刻不容缓 立马跟客户约好时间做替换 排除掉这一隐患.
   
一.实施前准备
1.提前制作好桌面云启动U盘(社区下载对应桌面云系统镜像,通过UltraISO等工具将镜像烧录至U盘即可)
2.协调400工程师进入后台备份网口配置(图1.1)以及一体机签名(一体机重装系统大概率出现网口乱序,导入好提前备份的网口信息可解决.图1.2
                    
                     路径:/boot/boot/net              路径:/boot/firmware/conf/vs/
                图1.1                                  图1.2
    ps:管理口做了聚合的话,最好备份下管理聚合口的mac地址 做到有备无患,在VMP5.4.5版本中可能会出现“恢复主机(x.x.x.x)网口mac地址与被恢复主机不一致”这种情况出现的话,后台重新修改管理聚合口的mac即可解决(图1.3).
           
    3.准备好集群补丁包,主机替换好系统盘后需要打上集群补丁包,有些包找不到可以找人工获取(管理--设备升级可看到对应补丁包信息.图1.4
                  
                                                                           (图1.4)
    4.通过巡检工具或者后台运行命令检测副本完整性,全部显示为0副本正常 显示1异常,需要协调400进行处理(图1.5)
     命令:vs_cluster_cmd.she '/sf/vs/bin/vs_localhost_checkok.js check_all; echo $?'
                                                                       
                                                                           (图1.5)
   5.查看替换系统盘主机是否为主控以及授权KEY是否插在主机上,如果是 需要切换其它主机为主控以及将key拔插至其它主机上(图1.6)
            (图1.6)
    6.查看网口配置信息 并截图保存好.
                    
  7.迁移替换主机虚拟机至其它主机运行(图1.7),这样可以不影响业务;集群资源不足的情况下,关闭单台主机虚拟机也可以进行操作,后者影响一部分虚拟机前提与客户沟通好.
         (图1.7)
二.实施更换
    1.检查好集群无数据同步任务,替换主机无虚拟机运行后 将主机暂停服务(图2.1)
                  
                                                                                 (图2.1)
     2.将主机关机,替换新的SSD系统盘并装好系统(一体机发过来的SSD系统盘一般都有系统,无需重装),主机安装好系统盘系统运行起来后,检测一体机签名是否丢失以及进入平台检查网口是否正常,网口乱序了的话可以导入先前备份好的网口配置进行解决;或者通过桌面云工具进行网口排序(个人更推荐直接导入网口备份 省时省力)
    3.对主机进行补丁升级,升级至与替换前一致的补丁信息。
            (图2.2
      4.安装好补丁后,配置好管理口IP以及聚合口(管理口IP,以及管理 业务 存储口聚合)并接好对应线.  
      5.登录集群,点击对应主机选择重建系统盘,点击下一步,系统根据主机硬件信息,自动匹配主机系统配置,点击校验主机,输入密码之后,点击完成,系统自动同步主机配置(配置同步好后,检查业务口 虚拟交换机配置是否正常),并将主机启动服务(点击主机-启动服务,未启动是灰色图标)图2.3
  
                                                     (图2.3)
      6.检查数据同步任务存储-数据同步和平衡任务执行状态,等待无数据同步任务后,检查副本一致性(图2.4)
                     
                                                                                    (图2.4)
      7.检测业务是否正常。集群一键检测或跑下桌面云巡检工具;登录VDI 连接虚拟机是否正常,无异常后完成替换操作.
总结:本次替换操作有几个点需要额外注意下
   1.系统盘是否需要做raid,有些老桌面云一体机系统盘是插在服务器后面的 这种是做不了raid的,后置的盘位raid卡检测不到;如需做raid需要额外添加一张raid卡.(如下图,我是两个480G的系统盘 先前准备做raid1 发现raid卡识别不到)
   2.重装系统后,网口乱序的问题,这个可以通过点亮主机网口去测试是否乱序。
   3.低版本的桌面云可能出现管理聚合口mac报错的问题。
        4.如果有好几台桌面云需要替换系统盘,只能一台台去做替换操作,桌面云存储默认是双副本,如果两台及以上主机无法提供服务,就会导致用户在登录时出现虚拟机丢失的情况。所以必须保证集群内的主机最多只能一台暂停服务。
   5.替换一台主机大概两个小时左右,时间允许的情况下 建议停机时间协调长一点 以备不时之需。
   6.替换主机打好补丁后,原来做了聚合的接口 需要手动去创建好聚合口
        
   实施前准备充分,希望大家交付时少踩坑。
  
       以上就是本次我替换实施的步骤以及需要注意的地方,有不足的地方希望大家可以指出来 相互学习共同进步。

打赏鼓励作者,期待更多好文!

打赏
2人已打赏

苏鹏 发表于 2023-12-21 16:42
  
非常详细,非常值得学习
发表新帖
热门标签
全部标签>
西北区每日一问
技术盲盒
安全效果
【 社区to talk】
技术笔记
干货满满
每日一问
信服课堂视频
新版本体验
GIF动图学习
技术咨询
功能体验
2023技术争霸赛专题
产品连连看
安装部署配置
通用技术
秒懂零信任
技术晨报
自助服务平台操作指引
原创分享
标准化排查
排障笔记本
玩转零信任
排障那些事
SDP百科
深信服技术支持平台
POC测试案例
畅聊IT
答题自测
专家问答
技术圆桌
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
产品预警公告
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
每周精选
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记
高手请过招
升级&主动服务
高频问题集锦
社区新周刊
全能先锋系列
云化安全能力

本版版主

468
227
32

发帖

粉丝

关注

7
11
24

发帖

粉丝

关注

5
7
7

发帖

粉丝

关注

31
34
45

发帖

粉丝

关注

本版达人

新手89785...

本周建议达人

YangZhe...

本周分享达人

runner

本周提问达人