#原创分享#超融合平台物理主机网口掉线问题排查
  

jingchx 28461人觉得有帮助

{{ttag.title}}
本帖最后由 jingchx 于 2021-3-31 10:48 编辑

1、平台版本:
      超融合平台版本 5.8.3
2、故障分析:
    今天超融合平台推送警告消息,提示一台物理主机eth3网口掉线,主机之间网络丢包情况,此警告导致运行在此物理主机上的虚拟机出现宕机迁移的情况。
3、故障排查:
      根据故障提示信息,首先去机房检查eth3网口和网线是否异常,检查发现网口和网线均正常,指示灯没有出现异常情况,为了验证硬件是否存在问题,果断更换了网线和交换机网口,提示问题依然存在,如果硬件问题,那就应该排查网卡问题了,但是网卡指示灯正常,初步判定网络线路应该没有问题。
      再从软件方面着手看一下,由于超融合是5.8.3版本,版本比较低,之前出现过物理主机运行时间过长出现了超融合平台数据备份策略不自动触发执行的问题,最后售后支持给出的由于主控运行时间超过了500天,平台有bug,导致不能自动触发备份策略,解决方案是重启了平台主控服务器,问题解决。考虑大概率还是平台bug问题,查看了一下掉线主机情况,运行时常769天,且该主机所有虚拟机均已关机迁移。
4、问题解决:
      于是果断的重启了一下物理主机,启动之后很快就收到了存储私网恢复正常的消息提醒,逐个把虚拟机再调度回来运行,经过这两天的观察,没有出现网口掉线的异常情况。
5、总结:
      由于版本问题,我们超融合平台2017年建成,2018年进行了升级扩容,之后两三年时间平台运行比较稳定,所以没有再进行版本升级更新,低版本bug还是比较多,现在新版本对硬件要求比较高的问题,果断向厂商询问制定方案,对超融合平台软件和硬件进行升级改造,避免类似的情况发生。

打赏鼓励作者,期待更多好文!

打赏
3人已打赏

jingchx 发表于 2021-3-31 15:25
  
飞翔的苹果 发表于 2021-4-2 08:47
  
感谢分享,有助于工作,学习学习
玉米 发表于 2021-4-26 12:50
  
感谢分享,非常实用,值得学习。
新手486484 发表于 2021-4-26 13:25
  
感谢分享,有助于工作,学习学习
新手888599 发表于 2021-8-10 08:54
  

感谢分享,有助于工作,学习学习
新手318074 发表于 2023-8-12 11:12
  
感谢分享,有助于工作,学习学习
发表新帖
热门标签
全部标签>
西北区每日一问
技术盲盒
安全效果
【 社区to talk】
技术笔记
干货满满
每日一问
信服课堂视频
新版本体验
GIF动图学习
技术咨询
功能体验
2023技术争霸赛专题
产品连连看
安装部署配置
通用技术
秒懂零信任
技术晨报
自助服务平台操作指引
原创分享
标准化排查
排障笔记本
玩转零信任
排障那些事
SDP百科
深信服技术支持平台
POC测试案例
畅聊IT
答题自测
专家问答
技术圆桌
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
产品预警公告
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
每周精选
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记
高手请过招
升级&主动服务
高频问题集锦
社区新周刊
全能先锋系列
云化安全能力

本版版主

189
299
979

发帖

粉丝

关注

217
288
151

发帖

粉丝

关注

25
13
5

发帖

粉丝

关注

7
11
24

发帖

粉丝

关注

5
7
7

发帖

粉丝

关注

31
34
45

发帖

粉丝

关注

本版达人

皮皮虾·真

本周建议达人

郑州网络

本周分享达人

二进制网络

本周提问达人