2.1. 问题现象描述 1、aDesk 5.5.0R1客户侧反馈终端盒子拨入VDC时,提示“网络连接超时,请稍后重试”,如下图; 2.2. 影响及范围 部分生产桌面云虚拟机无法接入,影响正常生产办公; 2.3. 问题处理过程 1. 通过盒子自带诊断功能,测试盒子至VDC连通情况,经测试可以正常ping通,无异常,如下图; 2. 在VDC上查看盒子的网络状态诊断等,也未发现有异常,如下图; 3. 在VDC控制台查看,告警选项及日志查看等均未发现有异常情况,如下图; 备注:日志多为上次核心变更日志,与本次无关; 4. 基于之前发生可能性,怀疑是有地址冲突存在,经过扫描工具及在核心上反复查看VDC集群地址的ARP信息,未发现对应IP有MAC变化情况,如下图; 备注:核对ARP信息无误。 5. 查看集群状态发现异常,持续观察10分钟以上,真实服务器的“节点类型”一直处于“数据校验中”,如下图; 6. 通过support内部支持平台,查看有类似问题,但是校验客户侧不满足,如下图; 备注:客户侧并无acenter集中管理平台,也并未启用相关功能。 7. 协调后端专家协助处理,经确认为因为iptables规则里面有部分端口丢失,导致真实服务器无法同步分发器数据,长期处于数据校验中,处理方案是在集群状态下打开SSH功能(VDC主机之间通信不用22端口,但是把22端口拉起来的时候同时会把二者通信的其他端口也重写拉起); 8. 在开启集群SSH维护之后,5分钟之内即会将通信端口拉起并进行数据协商,如下图,已显示正常; 2.4. 问题原因分析 1、设备运行中由于网络抖动等其他原因,致使iptables规则里面有部分端口丢失,导致VDC真实服务器无法同步分发器数据,致使其长期处于数据校验中,最终导致真实服务器无法对外提供服务; 1. 解决方案 1、在出现类似问题是在VDC集群控制台上开启SSH维护,等待五分钟之内即可完成数据同步,正常使用; 2、在桌面云最新版本中针对此问题做了版本修复,能够大大降低此类问题发生的概率,可考虑在生产业务岁修等时期进行版本升级维护; |