背景说明 HCI集群因业务发展,需要部署更多虚拟机,内存资源容量不足,需要对每台主机进行内存扩容。 与客户负责人、深信服市场负责人、渠道负责人沟通,提出解决方案: 选择业务低峰期,对集群网络进行优化,给所有主机增加内存条。变更前,向业务使用人员提前通知,保留/备份重要数据,并且在升级过程中禁止维护人员登录HCI进行操作维护。 变更目的 通过此次变更,提高集群业务承载能力和可靠性;对HCI集群内存进行扩容,便于客户后续业务部署。 变更范围 本次升级涉及到的产品说明,包括宁畅服务器4台。 变更影响 变更会对集群内四台宁畅服务器内存,扩容需要关机重启。需保障扩容完成后,客户所有虚拟机可正常使用,业务可正常访问且数据无丢失 对业务影响 变更过程需要重启设备,不会中断业务,需要和客户沟通预留窗口时间。 对操作维护影响 升级过程中禁止维护人员登录HCI进行操作维护 对客户网络影响 变更过程对客户超融合平台之外的网络通信对网络通信无影响。 变更操作指导 提前需要准备的工具、访控开通、高权账号、验证人员、对接部门人员等,务必提前沟通确认保证变更期间可以准时到位; 变更前准备 深信服准备 1、深信服产品相关变更方案; 2、便签纸、笔、螺丝刀; 3、工具准备:超融合智能交付工具; 4、完成深信服内部变更流程及获得贵单位变更授权; 客户准备 1、明确变更日期及变更窗口; 2、进行深信服提供变更方案评审; 3、协调相关业务部门人员进行变更前后业务验证; 4、升级过程中禁止客户运维人员进行操作维护; 5、授权深信服进行本次变更操作。 升级前检查 常规检查 | | | | | | | | | | | 检查需要扩容主机内虚拟机是否迁移至其他存储位置和主机 | | 使用超融合交付工具进行巡检,根据巡检报告结果修复相关问题 | HCI主机硬件扩容主机硬件扩容和验证 1. 点击【存储/总览】,查看当前虚拟存储是否有其他任务在执行,如果有任务在执行,请等待任务执行完毕后在执行下列操作; 2. 进行一键检查(一定要勾选虚拟存储数据检查); 3. 验证平台正常后,在【虚拟机】列表页面,依次在虚拟机内部关闭业务系统并关闭虚拟机; 4. 在【实体机】页面依次关闭所有的物理主机; 5. 确认设备断电后,拆卸所有外部线缆,如电源线缆、网线等; 6. 渠道工程师给服务器安装内存条和网卡; 7. 检测没有其它杂物遗留在机箱内,封盖还原; 8. 所有更换完毕后,开启服务器,确认服务器的网卡是否乱序; 9. 进入主机详情页面,检查内存和网卡识别,内存容量匹配是否符合预期; 10. 进行一键检测(一定要勾选虚拟存储数据检查)。 扩容后检查 平台检查 业务验证 客户检查HCI平台,并验证业务是否正常使用。 应急和回退方案 1. 为了避免扩容内存出现异常,应严格按照扩容步骤要求来完成操作;现场服务人员在上门操作之前,协调好必要的后端资源进行保障。 l 升级前巡检工具的例行巡检,提前识别缓存、硬件、日志中的异常并确认是否影响升级。 l 如果在升级过程中出现 VS 数据频繁同步等问题,及时协调 VS 的研发后台处理。 l 在升级成后通过巡检工具以及《升级后检查表》检查集群负载以及副本均衡的检测。 2. 在整个升级过程中,有客户服务中心工作人员远程值守,出现任何异常,快速接入并解决
|