记一次CSSP主机扩容! 背景介绍:在一个天昏月明的夜晚,如下图,去搞安全资源池主机扩容。 预先工作准备: 1、对客户的现网环境进行梳理,对现运行的CSSP进行检测。 2、对新增的第三方服务器(华为)进行系统安装,以及管理IP的配置,网络层次的划分。(注意:CSSP的存储口不需要提前聚合),装系统时候记得删除cssp和dc的虚拟机。 3、对设备的光纤以及硬件进行检查。 4、提前在集群的添加主机上查看是否能看到新增的主机。 实施过程: 一、主机扩容 1.1、登录CSSP集群IP,点击一键检测功能,(勾选对存储的检测),结果如下图。 告警信息没事,假如有报错,进行重新巡检,或者研发处理。(巡检会影响业务,空窗期干) 1.2、直接添加主机(提前看日志有无影响扩容的报错),然后下一步即可,同步补丁包信息,下一步即可。 等待一段时间,重新登录集群,会自动进行同步服务,完成即可登录集群。
到了这里集群的主机添加就结束了,下面是对存储进行扩容。 二、存储扩容 2.1、在虚拟存储页面上,点击扩容(注意这里是在没有存储任务执行的前提下),会提示配置虚拟存储通信。(注意交换机聚合和现网的配置一致即可) 2.2、在虚拟存储通信配置完成后,点击下一步即可,遇到报错,主机之间认证失败 解决方法:ssh算法不一样,在报错的主机的后台进行修改即可。 对应主机后台: vim ~/.ssh/config 文件删除字段blowfish-cbc之后解决 可以使用 ssh 目的主机IP,进行测试,无报错就是正常,警告也是正常。 全部修改后,可以继续点击下一步。 2.3、虚拟存储下一步后,是对磁盘进行检测,报错,磁盘不兼容,如下图。 解决方法:需要在集群的主控的主机后台执行命令:(注意必须是主控主机的后台) 命令: touch /sf/cfg/vs/.notcheckDC 已解决 2.4、解决后,点击下一步扩容,确定好磁盘信息即可。点击后,扩容失败,排查原因是fw问题,研发后台解决即可。 。
注意:扩容过程多观察日志报错和告警 PS:在扩容第二套主机时候,由于光纤原因,网口掉线,导致一个主机离线,如下图。 注意:这里是因为网口掉线问题,导致1台主机离线,离线主机自动成为主控。 解决方法:需要将离线的主机隔离出来,然后直连离线的物理主机上,去删除其余离线的主机和集群IP,只保留网口即可。重新添加。 PS2:添加存储网口的时候,提示速率不一样,在界面和后台查看网口速率都是一样的。 解决方法: 一直刷新这个添加存储过程,某次就自动匹配成功了,可能是由于网络速率问题导致,扫描不一样。 三、引流配置 按照CSSP主机扩容步骤,在虚拟架构中,在物理出口,HCI和CSSP的物理出口,分别加入新加的主机IP即可,可以登录CSSP查看引流主机是否添加。 结束语:搞了一晚上和一早上结束。总体来说问题比较多,不过有研发大哥的协助还是挺顺利,2套集群,分别扩3和5,花费时间约8个小时左右。 总结: 可以将一些花费时间的巡检等工作提前做好,可以节约变更时间。大胆心细的干就好了。 |