#原创分享#记超融合aCloud5.8.7R1一次巡检与整改经历,涉及开机迁移操作
  

Princeling 171984人觉得有帮助

{{ttag.title}}
   在上一个帖子分享GAP网闸实施的时候,在客户现象也对超融合系统做了一次工具巡检,并对巡检当中发现的一台服务器的CPU降频问题进行了业务迁移后,关机整改。
一:首先介绍一下客户这边超融合环境:
  客户是去年10月开始在两台HPDL380的服务器上测试深信服企业云aCloud,并于今年7月再次构买3台HP DL580服务器,总共五台HP服务器搭建的企业云。
整个集群采用两台信锐万兆交换机RS6300搭建分布式万兆存储网络实现两副本的建立,两台RS5300千兆交换机作为管理网络 业务网络 通信网络VXLAN的建立,然后又用了一台RS5300作为核心在网络机柜和该超融合服务器机柜之间通过光纤建立连接:
   
下图是具体的拓扑:
二:使用深信服企业级云智能交付工具aDeploy3.0进行巡检
    因为之前的巡检都是使用设备自身的一键检测进行巡检,本地体验一下深信服智能交付工具aDeploy进行一次巡检
社区下载工具:

下载该工具并解压使用,输入集群IP地址 用户 密码 开始全面巡检:

同意相关协议

开始进入巡检:


自动输出巡检报告 为word形式:

巡检报告检查发现集群中一台虚拟机出现了降频告警,因为HP服务器经常会遇到降频问题:


三:查看具体的主机运行情况,确认是否可以进行修复:
    因为客户超融合搭建时候用的是平台一键检测,当时降频问题已经处理过了,此次再次出现,小编怀疑是自己之前忽略了什么,在实体机页面查看192.168.50.156主机,目前只有两台业务主机,于是决定采用开机迁移运行位置到其他物理主机,将该台物理主机进行关机检查BIOS配置:

于是和客户说明后,开始进行开机迁移:


迁移运行位置:到155主机上,提前确认155主机资源足够迁移:
在更多其他操作中选择迁移:


  迁移杀毒服务器_内网比较顺利,但是迁移叫号服务的时候遇到问题了,一直卡在94%的状态,等了一个小时任然没有迁移成功,担心影响业务,再次确认操作无误时候,赶紧找专家协助:
  30分钟后专家组联系,再确认虚拟机内存是32GB基本已经判定,内存过大的虚拟机再开机迁移的时候成功率并不高,需要后台使用KVM的qm命令进行迁移:使用的有虚拟机的UUID信息,渠道同事只需要了解内存过大开机迁移可能会卡住的,命令和后台由专家组协助完成。
操作后迁移马上完成,业务无影响:
:界面关闭192.168.150.156主机,开始进入BIOS配置:
服务器再次手工开机,F9进入BIOS:

在RBSU中检查,最早检查忽略了一个设置:
关闭CPU节能模式:
Power Management--HP Power Profile--Custom
Advanced Power Options--Collaborative PowerControl--Enable
Advanced Power Options--Intel QPI LinkPower Management--Enable
五:开机再次检查,等待存储自动同步:
等待数据重建完成,将虚拟机迁移回去

六:经验总结:
超融合在搭建过程中,集群搭建完成后,一定要使用一键检测确认一切正常,一定要确保配置没有疏忽,小编此次搭建了五台服务器都有检查,但是不知道什么原因再二次巡检的时候发现了疏忽了一台服务器的BIOS配置:
希望给为小伙伴日后实施中一定按照操作步骤,检查好各项参数,以免客户上业务后,整改比较麻烦。

2019-11-20_150139.png (143.1 KB, 下载次数: 332)

2019-11-20_150139.png

打赏鼓励作者,期待更多好文!

打赏
6人已打赏

新手548437 发表于 2019-11-25 08:45
  
感谢分享。
feeling 发表于 2019-11-25 08:49
  
学习了,下次照着操作一下
Sangfor_闪电回_朱丽 发表于 2019-11-25 16:02
  
您好,感谢您参与社区原创分享计划4,您的文章已被收录到计划中,交由专家评审小组评审,分享奖励将在活动结束后统一安排发放!分享越多,奖励越多,期待您更多的精彩分享哦!:感恩:
新手780102 发表于 2019-11-26 09:43
  
回帖是美德
sangfor_闪电回_小六 发表于 2019-11-26 15:39
  
为楼主点赞,希望楼主多多分享干货!
DOI 发表于 2019-11-27 13:00
  
这才是干货啊
hzZ 发表于 2019-11-28 09:00
  
感谢分享
good_Knight 发表于 2019-11-29 09:42
  
思路很清晰,通过aDeploy巡检工具帮助解决用户问题
解决问题中遇到问题能够及时求助,感谢分享
新手031815 发表于 2019-12-2 17:48
  
这个是大佬,谢谢
发表新帖
热门标签
全部标签>
安全效果
西北区每日一问
技术盲盒
技术笔记
干货满满
【 社区to talk】
每日一问
信服课堂视频
GIF动图学习
新版本体验
技术咨询
2023技术争霸赛专题
功能体验
产品连连看
自助服务平台操作指引
标准化排查
秒懂零信任
技术晨报
安装部署配置
原创分享
排障笔记本
玩转零信任
排障那些事
SDP百科
技术争霸赛
深信服技术支持平台
通用技术
以战代练
升级&主动服务
社区新周刊
畅聊IT
答题自测
专家问答
技术圆桌
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
产品预警公告
信服圈儿
S豆商城资讯
「智能机器人」
追光者计划
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
每周精选
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记
高手请过招
高频问题集锦
POC测试案例
全能先锋系列
云化安全能力

本版版主

188
299
979

发帖

粉丝

关注

217
288
151

发帖

粉丝

关注

25
13
5

发帖

粉丝

关注

7
11
24

发帖

粉丝

关注

5
7
7

发帖

粉丝

关注

31
34
45

发帖

粉丝

关注

本版达人

皮皮虾·真

本周建议达人

郑州网络

本周分享达人

二进制网络

本周提问达人