提示
X
本案例来自tskb,请前往tskb修改源内容:立即前往
'>

进阶排查-第四步:获取盒子日志分析掉线或断连原因

|

问题描述

第四步:获取盒子日志分析掉线或断连原因

解决方案

一、ARM盒子日志分析
1、分析问题前需要在VDC上获取盒子日志


2、若是当天出现的问题,则直接查看logcat日志;若是需要查看昨天或历史的日志,可以查看hislog_log;


3、打开logcat日志后主要过滤关键字network-dog、timeout、errno等;
①如下所示过滤timeout,可以看到是因为连接超时触发的重连,这个时候就需要由获取客户端到VMP服务器之前的网络拓扑,由客户侧协助分析网络了;


②如下所示过滤关键字network-dog,可以看到有7个重传包。有重传包网络不一定会直接掉线,但可以确认网络是不稳定的,因此还需要结合超时重连、errno等错误日志或代码进一步确认,


注意:
recv_err:表示接受到的错误包
err:表示发送的错误包
retrans:表示重传包

③如下图所示过滤关键字errno,有104错误码,则基本定位网络问题,

过滤ping_package_put_package,可以查看到日志中显示包iD,包的延时时间,平均延时时间。

在logcat中过滤down字段,能看到盒子网卡一直在down/up,这是盒子网卡在重启

解决方法参考:
http://tskb.sa

ngfor.com/forum.php?mod=viewthread&tid=34798&page=1&extra=#/pid45519以上字段任意过滤到一个,都说明盒子的网络环境不稳定。
二、x86盒子日志分析
X86盒子中,日志是/var/log/system.log,打开日志后主要过滤关键字过滤setNetDelaysButtonShow字段,日志中会显示平均延时、当前延时,有此字段说明客户端网络环境较差,正常环境下无此字段日志。






操作影响范围

无影响

建议与总结

转L3需提供以下信息:
1、故障现象描述:
2、故障发生时间:
3、故障影响范围:单个盒子还是所有盒子,还是某个网络下面的盒子,盒子掉线\断连的时间点
4、故障前做过的操作:首次部署,还是使用过程中出现的问题
5、设备部署模式及网络拓扑:VDC的部署模式,VMP服务器到盒子中间的网络情况或拓扑
6、设备详细版本信息:VDC的详细版本信息
7、VMP、VDC、虚拟机等平台服务端是否有异常:主机\存储离线,虚拟机异常,VDI服务启动失败等;
8、盒子ROM版本是否匹配:
9、网络是否有延时丢包:VDC客户机管理中可以检查网络是否有丢包延时
10、获取盒子日志及上述关键信息是否正常获取;

我要分享
文档编号: 206905
作者: admin
更新时间: 2023-06-25 15:04
适用版本: