新手989729 发表于 2020-1-3 12:02
  
干货满满,感谢楼主的分享!
新手612152 发表于 2020-3-4 09:25
  
拿来好好研究下
新手439201 发表于 2021-1-5 15:36
  
记录很详细,学习了,感谢分享
新手837717 发表于 2021-1-8 20:54
  
感谢楼主分享,这个很实用。
362066 发表于 2021-1-28 09:32
  
干货满满,感谢楼主的分享!
飞翔的苹果 发表于 2021-10-22 08:39
  
感谢分享,有助于工作,学习学习
#原创分享#记超融合aCloud5.8.7R1一次巡检与整改经历,涉及开机迁移操作
  

Princeling 106924人觉得有帮助

{{ttag.title}}
   在上一个帖子分享GAP网闸实施的时候,在客户现象也对超融合系统做了一次工具巡检,并对巡检当中发现的一台服务器的CPU降频问题进行了业务迁移后,关机整改。
一:首先介绍一下客户这边超融合环境:
  客户是去年10月开始在两台HPDL380的服务器上测试深信服企业云aCloud,并于今年7月再次构买3台HP DL580服务器,总共五台HP服务器搭建的企业云。
整个集群采用两台信锐万兆交换机RS6300搭建分布式万兆存储网络实现两副本的建立,两台RS5300千兆交换机作为管理网络 业务网络 通信网络VXLAN的建立,然后又用了一台RS5300作为核心在网络机柜和该超融合服务器机柜之间通过光纤建立连接:
   
下图是具体的拓扑:
二:使用深信服企业级云智能交付工具aDeploy3.0进行巡检
    因为之前的巡检都是使用设备自身的一键检测进行巡检,本地体验一下深信服智能交付工具aDeploy进行一次巡检
社区下载工具:

下载该工具并解压使用,输入集群IP地址 用户 密码 开始全面巡检:

同意相关协议

开始进入巡检:


自动输出巡检报告 为word形式:

巡检报告检查发现集群中一台虚拟机出现了降频告警,因为HP服务器经常会遇到降频问题:


三:查看具体的主机运行情况,确认是否可以进行修复:
    因为客户超融合搭建时候用的是平台一键检测,当时降频问题已经处理过了,此次再次出现,小编怀疑是自己之前忽略了什么,在实体机页面查看192.168.50.156主机,目前只有两台业务主机,于是决定采用开机迁移运行位置到其他物理主机,将该台物理主机进行关机检查BIOS配置:

于是和客户说明后,开始进行开机迁移:


迁移运行位置:到155主机上,提前确认155主机资源足够迁移:
在更多其他操作中选择迁移:


  迁移杀毒服务器_内网比较顺利,但是迁移叫号服务的时候遇到问题了,一直卡在94%的状态,等了一个小时任然没有迁移成功,担心影响业务,再次确认操作无误时候,赶紧找专家协助:
  30分钟后专家组联系,再确认虚拟机内存是32GB基本已经判定,内存过大的虚拟机再开机迁移的时候成功率并不高,需要后台使用KVM的qm命令进行迁移:使用的有虚拟机的UUID信息,渠道同事只需要了解内存过大开机迁移可能会卡住的,命令和后台由专家组协助完成。
操作后迁移马上完成,业务无影响:
:界面关闭192.168.150.156主机,开始进入BIOS配置:
服务器再次手工开机,F9进入BIOS:

在RBSU中检查,最早检查忽略了一个设置:
关闭CPU节能模式:
Power Management--HP Power Profile--Custom
Advanced Power Options--Collaborative PowerControl--Enable
Advanced Power Options--Intel QPI LinkPower Management--Enable
五:开机再次检查,等待存储自动同步:
等待数据重建完成,将虚拟机迁移回去

六:经验总结:
超融合在搭建过程中,集群搭建完成后,一定要使用一键检测确认一切正常,一定要确保配置没有疏忽,小编此次搭建了五台服务器都有检查,但是不知道什么原因再二次巡检的时候发现了疏忽了一台服务器的BIOS配置:
希望给为小伙伴日后实施中一定按照操作步骤,检查好各项参数,以免客户上业务后,整改比较麻烦。

2019-11-20_150139.png (143.1 KB, 下载次数: 149)

2019-11-20_150139.png

打赏鼓励作者,期待更多好文!

打赏
6人已打赏

发表新帖
热门标签
全部标签>
每日一问
技术盲盒
干货满满
技术笔记
新版本体验
产品连连看
功能体验
2023技术争霸赛专题
技术咨询
信服课堂视频
标准化排查
社区帮助指南
秒懂零信任
技术晨报
自助服务平台操作指引
答题自测
安装部署配置
上网策略
SANGFOR资讯
通用技术
GIF动图学习
VPN 对接
项目案例
专家分享
畅聊IT
专家问答
技术圆桌
在线直播
MVP
网络基础知识
升级
安全攻防
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
原创分享
解决方案
sangfor周刊
技术顾问
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
排障笔记本
产品预警公告
玩转零信任
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
每周精选

本版版主

217
275
151

发帖

粉丝

关注

本版达人

皮皮虾·真

本周建议达人

郑州网络

本周分享达人

二进制网络

本周提问达人