第1章 背景说明 客户由于后期规划在HCI平台部署大量业务,现将当前平台资源CPU,内存进行扩容,为了应对业务系统对硬件资源的需求,需要对现有超融合平台的硬件资源进行扩容。 第2章 变更目的 1.对集群主机的内存、CPU进行扩容,降低主机的内存和CPU的使用率,提升平台的资源承载能力。 2.对集群进行主机扩容,提升平台的资源承载能力。 扩容完毕后使整个集群的CPU利用率不高于65%,内存利用率不高于70%,存储利用率不高于80%。
第3章 变更设备情况介绍 3.1 变更范围 本次变更涉及到HCI主机4台,需在新增一台第三方服务器安装HCI系统后添加到原集群内。 3.2 设备信息 本次变更的设备用于用户业务的扩容场景:
| [size=12.0000pt]设备[size=12.0000pt]版本
|
| [size=12.0000pt]其他(如机柜位置)
|
|
|
|
|
第4章 变更内容情况说明:补丁包说明 4.1 补丁包、定制包已做的测试结果: 客户原有集群内存在补丁包,需要加入集群的主机需要把补丁包打好在加入集群内。 第5章 变更影响 1.对主机内存进行扩容,需要将原有主机置于维护模式,然后关机进行内存添加。在将主机置于维护模式时,需要将运行在该主机的虚拟机关机或者迁移到其他主机。如果是热迁移则在迁移过程中会对业务系统性能有短暂影响,请提前告知客户。在集群主机资源不足(CPU或内存)时,则必须关闭虚拟机,此时则需要客户提前预留好停机时间; 2.主机扩容会触发数据平衡,建议在业务空闲时段进行操作。数据平衡速度在30MB/s左右,请提前预估同步数据所需时间,如果平台的业务IO比较高则同步速度会降低,因为数据同步的优先级较低;由于数据平衡的时间较长,并且在集群有任务进行时无法对集群进行版本升级或补丁升级,建议在扩容前进行版本或补丁升级;
第6章 变更责任人 注:本次变更涉及的第三方设备操作人员需由第三方厂家进行人员安排,共同完成本次变更操作。 第7章 变更准备工作 提前需要准备的工具、访控开通、高权账号、验证人员、对接部门人员等,务必提前沟通确认保证变更期间可以准时到位; 提前调研了客户升级环境,确定变更升级时间,准备客户设备配置文件保留; 7.1 深信服准备: 1、深信服产品HCI变更方案; 2、5.8.7R1版本启动U盘; 3、对变更相关内容进行实地考核,确认变更环境无误,包括且不限于设备升级序列号有效期确认,设备硬件性能确认等; 4、完成深信服内部变更流程及获得贵单位变更授权 7.2 客户准备: 1、明确变更日期及变更窗口; 2、进行深信服提供变更方案评审; 3、协调相关业务部门人员进行变更前后业务验证; 4、准备好相关变更设备的高权账号密码; 5、授权深信服技术人员进行本次变更操作。 第8章 变更步骤 8.1 业务、设备状态记录和配置备份 1、确定业务状态 验证变更设备功能以及涉及到的业务系统可以正常提供服务,并记录正常状态; 2、记录设备状态 设备的CPU、内存使用率、业务状态、节点状态; 3、配置备份
设备配置备份,订制功能的模块需要额外截图保存,防止订制功能配置未保存; 1.1 进行变更升级操作 8.2.1内存/CPU扩容步骤 1、首先需要把授权更新至对应CPU核数; 2、点击[存储/总览,查看当前虚拟存储是否有其他任务在执行,如果有任务在执行,请等待任务执行完毕后在执行下列操作; 3、进行一键检查(一定要勾选虚拟存储数据检查); 4、将需要扩容的主机上运行的虚拟机和虚拟网络设备迁移至其他主机内; 5、确认设备断电后,拆卸所有外部线缆,如电源线缆、网线等,开始拆机进行内存、CPU添加; 6、CPU,内存添加完成后设备加电开机,开机后进行一键检测; 7、每台主机依次进行迁移,关机,数据同步完成后在进行下一台服务器扩容。 8.2.2主机扩容步骤 1、在[实体机/物理主机中点击<添加主机>。 2、选择需要添加的主机,如果需要添加的主机不在列表中,点击<+>进行添加。提示将清除防火墙配置,点击<确认>。 3.点击[存储/虚拟存储/扩容]。 4.根据实际网络,选择虚拟存储通信网络部署模式。 5.选择合适的存储网口,并配置IP。 6.再次点击<扩容>,选择需要进行主机扩容的存储卷;点击[主机扩容,确认存储卷的扩容方式为主机扩容。 file:///C:/Users/admin/AppData/Local/Temp/ksohtml7764/wps26.png 7.进行磁盘的配置,建议SSD作为缓存盘,HDD作为数据盘和热备盘。 5.8.7R1版本设置HDD为热备盘时,需先将HDD从硬盘组中移除,再单独设置为热备盘。 8.扩容后进行一键检测,确认集群正常运行。 9.配置物理出口,将扩容主机的业务网口关联到物理出口上。 10.扩容完成后,可在业务低峰期,配置数据平衡计划,将新扩容的存储空间均衡。在[存储/虚拟存储中点击<高级配置>。选择[可靠性配置/数据平衡计划,启用数据平衡,并设置数据平衡执行时间。 第1章 变更后验证 1.1 业务状态验证 业务验证:验证设备功能及涉及到的业务系统可以正常提供服务,结合变更前验证对比; 1.2 设备状态验证 1.进入主机详情页面,检查内存CPU、内存识别,容量匹配是否符合预期。 2.查看新加入的主机是否正常运行。 3.使用平台一键巡检进行巡检查看是否有其他问题。
第2章 应急处理措施和回退方案 2.1 应急处理措施 1、验证结果非预期现象,进行问题处理排查; 2、 3、问题30分钟内无法解决,及时上报大区主管进行协调处理; 2、按照问题升级流程,对问题进行升级处理,如导致事故需立即上报区域主管和大客户服务经理进行升级。 2.2 回退方案 回退变更操作: 1. 若扩容主机失败将服务器恢复到之前的状态,注意要一台一台进行迁移关机数据同步后在进行下一台操作。 2. 若新增的主机加入集群失败,则进行回退操作至物理脱离旧有集群状态,具体操作为拔掉管理、业务、存储、Vxlan网口网线,取消加入集群操作。 3. 待所有主机恢复到变更前后,使用巡检工具对平台进行巡检确认。 4. 待此次问题确认之后再次协商窗口期进行扩容。 |