×

深信服超融合扩容 打赏(3026) 点赞(122)
  

新手182831 1244

{{ttag.title}}
原集群中有7台主机,版本6.7.0_R2,主机硬件有8口,2个光口,6个电口,2光口跑存储,管理、业务、数据两两聚合,跑的电口,不存在复用。无补丁记录。

新增两台主机:主机2024.6出厂,一体机,自带的6.8.0版本,6口,2个光口,4个电口。

现要将两主机加入集群,方法如下:
①降低两个主机版本,加入集群。②升级集群版本,加入集群。根据环境,选①。


一、对主机重新安装重装系统






注:选择446G作为系统盘,选在其他磁盘会把磁盘的签名格式掉。



安装完后,不需要激活授权,需要更新集群的授权,在将主机添加进集群。



遇到的第一个问题:主机降低版本后,发现物理接口跟逻辑接口乱序(乱序如图物理0口对应逻辑2口),用巡检工具aDeploy更改接口顺序后重启,发现还是乱序,用脚本,进底层改后重启,依然乱序。

(发现过程:在eth0配置了管理IP,发现https://管理IP后显示不出来,在eth2配置IP,在把网线接在eth0口,登录https://eth2口IP,就可以)


联系二线,进入底层更改后也不行。




后面发现是已知问题,修改不了。

解决办法:要么升级集群版本,要么贴标签,加入集群。

这里选择贴标签。乱序只是物理接口跟逻辑接口对不上,对带宽等没影响,因为调了很多次,顺序都比较乱了,重装系统后,两台乱序的结果都是一致的。硬件网卡跟软件版本适配问题。




二、加入集群

1、授权

目前集群是7台主机,授权占用完了,只能先更新授权,在加入集群。联系销售(把key id发给他),开授权。


更新后



2、配置网口

因为少了2个网口,所以需要做复用,逻辑口规划是eth0,1存储,eth2,3管理聚合,eth4,5业务数据复用聚合。 参考原集群中,物理网络、网口功能的配置,设置新增31、32两台的配置。





新增两台IP规划




3、加入集群

因为管理接口对端接的交换机,交换机接口没有写配置,所以集群跟主机不通


在对端交换机上修改接口,加入vlan(管理加入了vlan2。数据原集群是A口vlan 40,业务是T口vlan1,这里先将业务数据接入的vlan40,这也为后面的报错埋下伏笔,因为原集群业务数据没有复用,走的不同vlan,但新增的两台做了复用,不可能一个接口配置1个T口vlan1,1个A口vlan40)

管理、存储交换机(两台,做的聚合)


业务数据交换机(两台,做的聚合)


配置完交换机后,加入集群,添加物理主机,扩容卷的时候,

发现有块盘的签名丢了,估计是后面重装系统的时候,选错了盘,安装系统安装错了,把签名挤掉了。只能重装系统,重新签名。



还以为签名丢了,磁盘会亮红灯


没办法,只能删除主机


然后重装系统,记得选的好像是这446G


将签名导入,先检查一下系统盘,在加入集群


验证OK了


在添加

添加失败


昨天加进去应该占了,估计没释放。没办法,又只能重新导入授权,然后在扩容。

这时发现,他们以前部署的每个磁盘比例都不一样。

超融合从5.8.6版本开始,只扩容磁盘到虚拟存储不扩容主机时虚拟机可以正常使用,超融合上添加磁盘到虚拟存储时不需要关闭虚拟机,但是扩容磁盘后涉及数据重建与平衡,会占用一定存储IO对业务有影响,建议在业务空闲时操作。

注意:
1、HCI设备从标准版本5.8.6版本开始,不支持单独扩容SSD作为缓存盘,可以同时扩容缓存盘和数据盘或者单独扩容数据盘。

2、2主机集群场景扩容主机扩容虚拟存储场景虚拟机要关机操作



然后等就行了,估计十来分钟

扩容前200T

扩容两台主机后300T


然后在编辑网络拓扑,大致就完成了。


因为之前主机没有端口复用,但新增的有端口复用,所以出现这个是正常的

本以为已经大功告成了,然后发现了告警



出现这个告警,感觉是交换机配置没做好。

然后跟客户汇报了一下扩容完成的工作情况,说告警是没做聚合导致的。之前遇到问题的时候,没人跳出来,扩容完了,就有人这时候跳出来说要远程看看,还以为他要帮我做聚合


]结果那人排查两小时后,说没做聚合,喊我做聚合。把我整神了。



做了聚合后,在检测,都正常。
但因为业务口在 一键巡检中,检测不出来,所以只能用虚拟机迁移检测(在原来集群某主机上运行,笔记本ping虚拟机,然后虚拟机迁移到新增主机,不中断就行)。



因为之前主机有8个接口, 存储两个光口,管理、业务、数据两两做的聚合没有复用。数据交换机接口配置的A口,vlan40,数据交换机接口配的T口,vlan1

新增的主机只有6个接口, 存储两个光口,管理两个口做的聚合,业务、数据复用做的聚合,业务数据交换机接口配的A口,vlan40

所以这时候测试不得行

在几经思考后,业务接口要能通所以vlan,在业务数据的聚合口下,添加了子接口,vlan40。在交换机那边,将A口vlan 40 改成了T口,vlan1



这里的vlan1 就是放通所有vlan



然后再测试,业务迁移到两台新增主机,都OK了


在对集群巡检一遍,没问题后撤离


出门后又发现车轮被人锁了。。。

打赏鼓励作者,期待更多好文!

打赏
1人已打赏

牛风喜 发表于 2024-7-26 10:00
  
深信服超融合扩容,每日一积累慢慢变专家
原鹏程 发表于 2024-7-26 16:48
  
感谢楼主分享,努力学习中!!!!
发表新帖
热门标签
全部标签>
西北区每日一问
每日一问
技术盲盒
干货满满
技术笔记
新版本体验
信服课堂视频
GIF动图学习
排障那些事
产品连连看
功能体验
技术咨询
升级&主动服务
标准化排查
2023技术争霸赛专题
网络基础知识
运维工具
每周精选
自助服务平台操作指引
答题自测
专家问答
SDP百科
秒懂零信任
高手请过招
MVP
安装部署配置
问题分析处理
项目案例
存储
信服圈儿
S豆商城资讯
通用技术
以战代练
畅聊IT
技术圆桌
在线直播
升级
安全攻防
上网策略
测试报告
日志审计
流量管理
每日一记
云计算知识
用户认证
原创分享
解决方案
sangfor周刊
VPN 对接
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
迁移
加速技术
排障笔记本
产品预警公告
玩转零信任
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
技术晨报
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记

本版版主

10
17
2

发帖

粉丝

关注

124
74
30

发帖

粉丝

关注

26
8
0

发帖

粉丝

关注

70
37
1

发帖

粉丝

关注

6
14
0

发帖

粉丝

关注

17
10
5

发帖

粉丝

关注

本版达人