#原创分享#超融合平台物理主机网口掉线问题排查
  

jingchx 39541人觉得有帮助

{{ttag.title}}
本帖最后由 jingchx 于 2021-3-31 10:48 编辑

1、平台版本:
      超融合平台版本 5.8.3
2、故障分析:
    今天超融合平台推送警告消息,提示一台物理主机eth3网口掉线,主机之间网络丢包情况,此警告导致运行在此物理主机上的虚拟机出现宕机迁移的情况。
3、故障排查:
      根据故障提示信息,首先去机房检查eth3网口和网线是否异常,检查发现网口和网线均正常,指示灯没有出现异常情况,为了验证硬件是否存在问题,果断更换了网线和交换机网口,提示问题依然存在,如果硬件问题,那就应该排查网卡问题了,但是网卡指示灯正常,初步判定网络线路应该没有问题。
      再从软件方面着手看一下,由于超融合是5.8.3版本,版本比较低,之前出现过物理主机运行时间过长出现了超融合平台数据备份策略不自动触发执行的问题,最后售后支持给出的由于主控运行时间超过了500天,平台有bug,导致不能自动触发备份策略,解决方案是重启了平台主控服务器,问题解决。考虑大概率还是平台bug问题,查看了一下掉线主机情况,运行时常769天,且该主机所有虚拟机均已关机迁移。
4、问题解决:
      于是果断的重启了一下物理主机,启动之后很快就收到了存储私网恢复正常的消息提醒,逐个把虚拟机再调度回来运行,经过这两天的观察,没有出现网口掉线的异常情况。
5、总结:
      由于版本问题,我们超融合平台2017年建成,2018年进行了升级扩容,之后两三年时间平台运行比较稳定,所以没有再进行版本升级更新,低版本bug还是比较多,现在新版本对硬件要求比较高的问题,果断向厂商询问制定方案,对超融合平台软件和硬件进行升级改造,避免类似的情况发生。

打赏鼓励作者,期待更多好文!

打赏
3人已打赏

jingchx 发表于 2021-3-31 15:25
  
飞翔的苹果 发表于 2021-4-2 08:47
  
感谢分享,有助于工作,学习学习
玉米 发表于 2021-4-26 12:50
  
感谢分享,非常实用,值得学习。
新手486484 发表于 2021-4-26 13:25
  
感谢分享,有助于工作,学习学习
新手888599 发表于 2021-8-10 08:54
  

感谢分享,有助于工作,学习学习
新手318074 发表于 2023-8-12 11:12
  
感谢分享,有助于工作,学习学习
发表新帖
热门标签
全部标签>
2025年技术争霸赛
新版本体验
每日一问
标准化排查
GIF动图学习
功能体验
高手请过招
排障笔记本
纪元平台
每日一记
产品连连看
信服课堂视频
网络基础知识
社区新周刊
排障那些事
技术笔记
技术圆桌
安装部署配置
运维工具
技术盲盒
2024年技术争霸赛
【 社区to talk】
答题自测
原创分享
VPN 对接
玩转零信任
2023技术争霸赛专题
天逸直播
秒懂零信任
平台使用
山东区技术晨报
每周精选
北京区每日一练
畅聊IT
专家问答
在线直播
MVP
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
用户认证
解决方案
sangfor周刊
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
产品预警公告
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
卧龙计划
华北区拉练
以战代练
技术晨报
文档捉虫
齐鲁TV
华北区交付直播
场景专题
故障笔记
西北区每日一问
升级&主动服务
高频问题集锦
POC测试案例
全能先锋系列
安全效果
云化安全能力
专家说
热门活动
产品动态
行业实践
产品解析
关键解决方案

本版版主

198
367
1013

发帖

粉丝

关注

7
15
28

发帖

粉丝

关注

12
8
1

发帖

粉丝

关注

本版达人

皮皮虾·真

本周建议达人

郑州网络

本周分享达人

二进制网络

本周提问达人