一、故障现象二合一版本桌面云,部分盒子接入网络登录虚拟机时网络时断时续问题,故障现象如下:
二、客户网络环境说明
①客户网络做了准入认证(盒子要进行哑终端免认证)盒子才能正常接入网络使用 ②客户侧盒子及终端在完成接入认证后全部通过DHCP方式自动获取地址 ③部分接入网络后时断时续问题,使用电脑或其他盒子测试,其他盒子和电脑能够正常接入网络 ④盒子到HCI及VDC网络中无安全设备进行拦截
三、排查分析
①部分盒子接入网络存在网络时断时续问题,使用个人电脑PC接入同样位置后不存在网络时断时续问题(说明客户线路没有什么问题) ②由于盒子是DHCP场景获取IP地址,手动将DHCP获取到的IP地址手动静态配置到盒子端进行测试,网络还是时断时续(说明:盒子替换客户原有锐捷胖终端时,锐捷胖终端的网络是没有问题的),这里唯一的几个变量就是:第一、盒子DHCP获取到的IP地址不一样、第二盒子MAC地址不一样,但是客户这里使用DHCP获取IP就没有怀疑会存在IP地址冲突情况 ③使用接入网络正常的盒子接入到不正常的点位,接入正常,此时唯一的变量就是盒子获取到的IP不一样、MAC地址不一样,这里就很奇怪,从盒子上长ping HCI集群地址,从HCI及盒子后台抓包查看,HCI上抓包结果显示一直在给盒子有回包但是盒子这边时断时续,定期收不到来自HCI的回包,从盒子ping测试结果来看网路时断时续很符合IP地址冲突或MAC地址冲突现象 ④从客户华三认证平台去看,又看不到地址冲突情况,故此时排查陷入僵局,有问题的盒子手动配置静态IP接在客户核心交换和汇聚交换后登录桌面云就正常,接入边缘交换就会出现异常,但是客户拿自己电脑接入测试网络又无问题,使用PC安装VDI软终端后接入边缘交换测试登录桌面云业务异常,说明客户认证和网络又无问题!!! ⑤重新复盘,拿有问题的盒子手动配置无占用IP测试,盒子再无丢包情况,将盒子地址获取方式重新改为DHCP后盒子又出现时断时续问题,将盒子网线拔掉之后使用其他入网正常电脑ping盒子DHCP获取地址,在盒子离线情况下,还能ping通,证明DHCP下发的地址已在其他地方志占用,导致地址冲突。最后配合华三和客户排查,底下网络终端有部分配置了静态IP导致部分地址从DHCP下发后和静态IP一直冲突
四、排查结论
①盒子DHCP获取到地址和客户网络中静态配置哑终端地址冲突导致大批量盒子网络时断时续(客户DHCP网络下发IP冲突) ②还有一种可能性就是客户网络未划分vlan,广播报文较多导致盒子网卡被异常广播包占用后导致盒子网络时断时续(其他场景遇到问题) ③建议:客户环境问题导致盒子异常,使用坚持通过现象反查客户网络,DHCP场景也有存在IP冲突情况,不要用经验导致排查方向错误,避坑、避坑、避坑、避坑!!!!
|