×

【7月31日-技术盲盒】高频知识汇总-HCI篇(一)
  

农夫山泉有点咸 1139510人觉得有帮助

{{ttag.title}}
一、集群缩容(主机缩容工具)
场景说明
部分HCI用户需要将集群内、卷内的主机移除出集群,针对该场景,制作工具为4主机及以上集群提供缩容服务
注意事项
缩容工具注意事项汇总(含历史版本注意事项)
序号
问题描述
备注
1
复合卷不支持缩容
2
卷至少4个数据节点
3
被删除主机要保持在线,存储网和管理网都正常
4
若缩容主机失败,且失败后确认集群有任务在进行,等相关任务完成后,重试即可,若多次重试失败,联系技术支持

5
不支持多主机同时缩容,如果环境需要缩容多台,需要一台一台进行,每一台执行缩容都要完整执行一次缩容流程
6
缩容过程中,不支持任何集群运维(如替换、扩容、维护模式、卡慢盘处理等)操作,处于集群运维操作状态下,不支持执行缩容
7
不支持3副本缩容成2副本
8
630系列不支持5主机缩容成4主机
9
副本异常情况下不支持缩容
10
手动退出维护模式下,需要重新以【优先保证数据安全】模式进维护模式才能继续缩容
11
4主机环境下,被缩容主机的容量加上剩余的最大使用率主机容量除以剩余最大使用率主机的总容量高于90%就不允许缩容
若不满足该项缩容前置检查会主动拦截;4主机缩容,可简单计算缩容后的已使用容量建议60%,否则前置检查可能失败
12
当前仅支持:HCI630R3、HCI670R3、HCI680、HCI680R1、HCI680R2、HCI681、HCI681R1、HCI690、HCI691,包括对应的中英文版,以及beta版
13
缩容过程中工具会自动关闭环境的数据平衡功能,在迁移数据完成后,点击继续缩容才会重新开启数据平衡功能(用户也可以手动开启)
14
磁盘组迁移数据失败后重试会从0%开始
已经迁移的数据不会重新迁移
15
630R3重启执行主机(vs主控)670R3680系列缩容过程中重启被缩容主机后,缩容会卡住,若遇到缩容卡住时请联系技术支持
缩容过程中不要重启任何主机
16
缩容过程中会存在多次性能1-2s下降,建议业务空闲期进行
17
670以下版本,被缩容主机的共享盘连接数量在20个以内时,断流会在1-2s;如果超过20个,请联系技术支持评估
总共享盘数除以卷内总主机数大于20个才需要评估
18
需要使用集群主控登录adeploy缩容工具,登录后进行切集群主控会导致删除主机失败,需要重新登录才能删除成功
如果想要缩容集群主控,需要先把集群主控切走,切走后再登录adeploy,不能先登录adeploy
19
缩容后容量使用率不能超过80%(会在前置检查拦住)
20
缩容过程中adeploy异常关闭或中断,不会影响缩容,重新登录即可;如果无法登录,联系LMT技术支持
21
主机缩容需要进行主机的数据重建,数据重建速度约1TB/3小时
请根据主机的使用率合理安排变更窗口
操作步骤
1、下载3.7.7.1及以上的adeploy缩容工具(下方工具版本仅做演示用,最新版本请联系技术支持下载
2、进入aDeploy工具
3、点击选择【工具箱】按钮,进入到工具箱界面,再点击【HCI主机缩容】按钮进入到主机缩容功能界面
4、仔细阅读使用说明介绍,确认无误后,勾选【我已确认】之后点击【确定】按钮,进入集群环境输入界面

5、输入需要缩容集群的主控ip、用户名、密码、端口号、SSH端口号之后,点击【登录】按钮,进入到【选择主机】界面

6、进入【选择主机】界面后,选择要缩容的主机(此处以10.174.3.11为例),选择完毕后,点击【下一步】按钮,进入【前置检查】界面
7、等待前置检查阶段各检查项正常检查通过后,工具会自动进入到【缩容】界面(如果此处存在检测项检查不通过,请联系技术支持确认
8、进入缩容界面后,点击页面的【一键缩容】按钮,会弹出确认框,确认弹出的风险信息可以接受后,输入集群密码,点击【确定】按钮,进行缩容主机(注意:输入密码完成并点击确定按钮后,工具页面侧不再支持回退与取消操作!!
9、点击【确定】按钮后,工具正式对选择的主机进行缩容,耐心等待数据迁移完成
10、数据迁移完成后会停下,页面【继续缩容】按钮会亮起,点击【继续缩容】按钮,确认弹窗信息无误后,输入集群密码进行后续缩容处理
11、缩容后置处理完成后,主机会被关机并剔除出集群,之后会自动跳转至【后置检查】界面,等待后置检查界面结束,确认检查结果无误后,即可点击完成,至此,该主机的缩容任务完成

二、虚拟机磁盘空间回收
场景:
用户发现虚拟存储的空间满了,想要通过删除虚拟机内部的文件,释放存储空间

限制:
用户必须在虚拟机的编辑页面,开启空间回收选项,在执行删除文件的操作才可真正释放空间。未开启空间回收选项删除文件,则存储空间不会释放。

兜底方案:
无论是linux还是windows方案,在未开启空间回收时,都无法释放存储空间;这种场景的兜底方案是:可以在虚拟机拟机里写入一个大文件,开启discard删除改文件即可释放。

备注:
当大文件大小=VM剩余空间大小+无法释放空间大小时,才可释放所有存储空间,,因为Guest Os优先使用剩余空间后,才会复写删除索引的存储空间。

磁盘空间释放流程

磁盘空间回收配置

注意:
discard功能生效条件:
1)虚拟机磁盘镜像使用精简或者动态分配方式。磁盘预分配时,不启用discard功能。
2)GuestOS内部文件系统启用discard功能。(windows操作系统默认开启,linux操作系统需要再挂载分区时指定参数开启)
3)虚拟机存储位置是VS存储,并且需要三主机及以上vs才支持discard(2主机vs不支持discard功能)。
4)磁盘空间回收功能默认关闭,由web控制台虚拟机编辑页面的“空间回收”开关来控制是否启动空间回收功能功能。
以磁盘级别提供空间回收功能。
只要空间回收功能开关启用,qemu discard功能就生效,启动时条件由管理面进行控制。
qemu支持在虚拟机开机状态下动态启用、禁用某个磁盘空间回收功能。

三、磁盘更换
磁盘离线故障场景:
(一)虚拟存储替换数据盘(风险操作)
使用场景:当集群中主机有磁盘故障时,可以使用新的磁盘进行替换操作(支持数据盘、缓存盘替换)。
前提条件
1. 新磁盘的容量大小需要大于或者等于原来磁盘大小,建议和故障磁盘的大小一致(严禁替换磁盘容量小于故障磁盘容量)。
2. 确保虚拟存储的任务执行页面没有任务在运行
3.替换磁盘需要确保存储私网正常,需要确保其他磁盘、主机没有在离线状态
注意事项
1. 替换磁盘后会触发数据同步,占用虚拟存储IO,建议在业务空闲时操作,数据同步过程中要避免服务器断电断网等
2. 若一体机设备的RAID卡是JBOD模式,此时磁盘支持热插拔,支持在服务器不 关机的情况下将故障磁盘拔下,再插上新磁盘。
3. 若一体机设备的RAID卡是RAID 0模式,此时磁盘不支持热插拔,需将服务器关机下电后再换盘,对新盘进行单盘设置为RAID 0操作,再进行前台页面操作。
4. 一体机磁盘故障后必须购买深信服的磁盘才可以进行磁盘替换,非深信服磁盘虚拟存储识别不到。
5. 新磁盘的位置必须和故障磁盘在同一台主机上,推荐使用原盘位。
6.第三方服务器替换磁盘方式和第三方服务器保持一致
操作步骤
1、先将故障磁盘拔出,将新磁盘插到故障磁盘主机上
2、在【存储】-【虚拟存储】-【硬盘管理】-【故障磁盘】或者【虚拟存储】-【配置】-【故障磁盘】 点击更换磁盘
3、勾选“我已准备完成”,点击下一步,选择用于替换的新的磁盘
4、勾选“我确定更换磁盘”,点击完成以执行更换操作
5、 更换完成后可以在平台的配置界面看到已经没有故障的磁盘。
6.、替换完成后,进行一键检测,确认平台运行稳定。
风险说明
替换单主机数据磁盘:需要先保障其他不替换磁盘的主机的副本是正常的
方法:从标准版本HCI5.8.8开始,一键检测支持勾选虚拟存储数据检测选项,支持界面检测副本完整性,
替换多主机数据盘:需要替换外的其他主机副本正常且需要替换完一台副本正常后在替换另外一台

(二)虚拟存储替换缓存盘(高危操作)
使用场景:
当集群中主机有磁盘故障时,可以使用新的磁盘进行替换操作(缓存盘替换)
前提条件:
1. 新磁盘的容量大小建议和故障磁盘的大小一致(严禁替换磁盘容量小于故障磁盘容量)。
2. 确保虚拟存储的任务执行页面没有任务在运行
注意事项 :
1、web替换缓存盘需要一块磁盘一块磁盘的替换,替换完一块以后等虚拟存储相关任务比如数据同步完成以后再检查副本一致性没问题以后才可以进行下一个磁盘替换,HCI5.8.8及之后版本可以控制台一键检测检查数据一致性,确认一致性没有问题就可以替换,5.8.8之前版本建议先联系深信服技术协助检查副本一致性
2. web界面替换磁盘后会触发数据同步,占用存储IO,对业务有影响,建议在业务空闲时操作
3. 若一体机设备的RAID卡是JBOD模式,此时磁盘支持热插拔,支持在服务器不 关机的情况下将故障磁盘拔下,再插上新磁盘。
4. 若一体机设备的RAID卡是RAID 0模式,此时磁盘不支持热插拔,需将服务器关机下电后再换盘,对新盘进行单盘设置为RAID 0操作,再进行前台页面操作。
5 一体机磁盘故障后必须购买深信服的磁盘才可以进行磁盘替换,非深信服磁盘虚拟存储识别不到。
6. 新磁盘的位置必须和故障磁盘在同一台主机上,推荐使用原盘位。
操作步骤:
1、先将故障磁盘拔出,将新磁盘插到故障磁盘主机上
2、在【存储】-【虚拟存储】-【硬盘管理】-【故障磁盘】或者【虚拟存储】-【配置】-【故障磁盘】 点击更换磁盘
3、勾选“我已准备完成”,点击下一步,选择用于替换的新的磁盘
4、勾选“我确定更换磁盘”,点击完成以执行更换操作
5、 更换完成后可以在平台的配置界面看到已经没有故障的磁盘。
高危操作风险说明:
一、插拔或者替换缓存SSD操作前确认检查项:
1.确认要拔多少台主机的缓存盘
2.检查副本状态是否是正常的(HCI5.8.8开始,一键检测支持勾选虚拟存储数据检测选项,支持界面检测副本完整性,之前版本需要后台检查副本完整性)
3.确认是多主机替换还是单主机替换缓存盘
二、操作风险说明
1、如果是已离线磁盘拔插不会有新影响(如果做了raid直接拔插raid要重新配置),如果是第三方服务器是否支持热插拔可找第三方确认
2、对正常的磁盘进行拔插
a、如果是单台主机的缓存盘拔插需要检查副本完整性是否一致,避免出现双点,如副本正常则会导致虚拟机io卡顿一下
b、如果同时拔多台主机的缓存盘则会导致大部分虚拟机直接挂起不能正常使用
3、替换单主机缓存盘:需要先保障其他不替换磁盘的主机的副本是正常的
4、替换多主机缓存盘:需要替换外的其他主机副本正常且需要替换完一台副本正常后在替换另外一台

磁盘未离线(如寿命到期,缓存盘换大盘)场景:
虚拟存储替换缓存盘(高危操作):
联系深信服技术支持进行缓存盘数据回刷再进行替换!!!

打赏鼓励作者,期待更多好文!

打赏
77人已打赏

UP 发表于 2024-8-1 11:00
  
第1次答题
答案:1.A
得分:100
暗夜星空 发表于 2024-8-1 11:11
  
感谢分享,有助于工作和学习
纯牛奶丶 发表于 2024-8-1 11:34
  

感谢分享,有助于工作和学习
何茂源 发表于 2024-8-1 11:50
  
感谢分享,有助于工资和学习!
何东升 发表于 2024-8-1 13:23
  
感谢分享,有助于工资和学习!
胡sir 发表于 2024-8-1 13:34
  
感谢分享,有助于工作和学习。
一抹月光 发表于 2024-8-1 13:52
  

感谢分享,有助于工作和学习
新手031815 发表于 2024-8-1 13:54
  
一起来学习,一起来学习
新手612152 发表于 2024-8-1 14:01
  

一起来学习,一起来学习
发表新帖
热门标签
全部标签>
安全效果
每日一问
西北区每日一问
【 社区to talk】
技术盲盒
干货满满
技术笔记
产品连连看
新版本体验
信服课堂视频
每周精选
技术咨询
标准化排查
GIF动图学习
2023技术争霸赛专题
功能体验
玩转零信任
社区帮助指南
技术晨报
答题自测
云计算知识
天逸直播
自助服务平台操作指引
社区新周刊
技术圆桌
运维工具
用户认证
资源访问
通用技术
畅聊IT
专家问答
在线直播
MVP
网络基础知识
安装部署配置
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
原创分享
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
地址转换
虚拟机
存储
迁移
加速技术
排障笔记本
产品预警公告
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
答题榜单公布
纪元平台
卧龙计划
华北区拉练
以战代练
秒懂零信任
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记
排障那些事
高手请过招
升级&主动服务
高频问题集锦
POC测试案例
全能先锋系列

本版版主

0
2
1

发帖

粉丝

关注

38
7
5

发帖

粉丝

关注

5
3
4

发帖

粉丝

关注

47
4
1

发帖

粉丝

关注

1
4
0

发帖

粉丝

关注

0
0
0

发帖

粉丝

关注

本版达人