超融合虚拟存储替换缓存盘方法及注意事项 超融合虚拟存储什么时候替换磁盘,一般都是虚拟存储的缓存盘坏了才去替换它。但本次我做的项目确不是这个原因,是因为整个超融合的集群虚拟机已经达到极限的极限,6台虚拟机上了120个虚拟机,不按计划上CPU内存,硬盘空间。SSD的缓存磁盘空间只剩下22G左右,为了不影响业务的运行速度体验,我们决定6台主机都要换缓存盘,由原来的480G换成960G的缓存盘,由于存储空间,CPU,内存都以满,换缓存盘首先要清空一台主机上的所有虚拟机,但由于资源的不足,还不能停止业务的使用,简直难上加难,还好,我们有二期超融合的项目在,才解决此次问题,我们把一期的重要业务的虚拟机40多台签到二期,才解决一期换缓存盘的难题,迁过的虚拟机在二期的CPU占比都达到200%多。在线迁这些虚拟机用了我4天-5天的工作时间,换一期缓存盘的时间是5天时间,大家就知道这工作量有多大了吧! 大家一定要注意,换缓存盘一定是一个高危操作,一定要先给400专家打电话由专家判断决定怎么换缓存盘。下面我就给大家介绍一下如何换缓存盘?以及遇到问题怎么解决? 一、操作步骤 1.首先进入实体机-选择要迁移的主机,然后进入主机界面,选择虚拟机,这时我们就可以看到所有的虚拟机在这台主机上。 选择更多操作-迁移 选择将每个虚拟机由当前运行位置迁移到目标运行位置,目标位置是选择你要迁移的目标主机,点击下一步 点击下一步 确认信息没有问题,点击确定。 从日志里看到在线的虚拟机都迁移到目标主机了,注意:如果迁移的虚拟机失败,请重新迁移目标主机里 这时在看当前主机所有的虚拟机全部迁移到目标主机里。 2、打电话找400专家,让400进后台做一下缓存盘是否可以替换的健康检查,注意:一个主机有2个缓存盘,只需要在后台检测一次,但每个主机都需要进行一次健康检测。才能进行缓存盘的硬盘隔离操作。再和大家说一下,本次操作换缓存盘版本是超融合6.9.0版本,如果是超低版本,可能是另一种操作步骤,一定要跟400专家确认一下操作流程,本操作是高危操作。操作步骤如下 (1)container_exec -n vs-cp (2)for b in $(gluster v i | grep host- | awk -F: '{print $1}' | grep -Eo '[0-9]+'); do vs_rpc_tool --cmd check --brickno "$b"; done (3)检测完毕,没有问题,可以进行下一步的缓存盘隔离这一步。 3.下面开始核心的操作,那就是硬盘缓存盘的隔离操作。点击存储-虚拟存储-磁盘管理 选择所要换缓存盘的虚拟存储主机的位置,选择磁盘组1,右击选择隔离磁盘 当缓存盘隔离后,该缓存盘所在硬盘组将停止服务,选择处理方式为快手隔离磁盘方式。单击确定。 采用快速隔离硬盘方式隔离硬盘,输入admin的密码,点击确定 在此次任务列表里显示硬盘已隔离完成。所有磁盘组1的缓存盘和数据盘都变成红色。 隔离缓存盘完成后,点击开启硬盘灯,主要是定位缓存盘的位置,在线换缓存盘。 选择3分钟。 这时走到超融合机柜前,找到定位好的缓存盘,此时硬盘灯是蓝色的,代表是隔离后的缓存盘位置。 此时可以不关机的情况下拔掉缓存盘。 将480G的缓存盘用螺丝刀拆掉。 将960G的缓存盘上到硬盘架上,并放入服务器硬盘槽内。 将缓存盘放入硬盘槽安装好。 然后选择点击替换硬盘 选择替换的硬盘,点击下一步。 选择我确定要更换磁盘,完成。 输入集群admin的密码,确定。 缓存盘开始替换。 数据开始同步 点击数据同步,查看详情 查看虚拟机数据同步任务 待数据同步完成后,这时这台主机磁盘组1的SSD更换完成。 二、更换主机第二块缓存盘方法 在更换第二块磁盘组2的缓存盘时,看下该主机虚拟机里是否有虚拟机,多刷新几次,如果有,迁移走,没有就可以更换第二块缓存盘了。更换的步骤和更换磁盘组1的步骤是一样的,就不详细介绍了。 隔离磁盘,然后开启硬盘灯,然后替换磁盘。 此时元数据平衡完成,没有问题。 数据同步完成。这时这台主机的2块缓存盘替换完成。在换另一台主机时,重复上面的步骤。一天能替换1.5-2台主机缓存盘。 注意:在这里要跟大家说一下,当隔离磁盘同步数据失败时,要取消隔离磁盘,再做隔离磁盘,不要同步数据失败,还做磁盘隔离,避免丢失数据,如果隔离磁盘没有失败,就可以替换磁盘了。如果还失败,找400。这种情况要耐心等待一下时间,同步数据是很慢的。毕竟是高危操作。 |