一、分享标题:XX省中波台音频业务部署我司HCI(680R2版本,C86架构)音频接收中断问题排查思路及分享
二、问题现象 客户音频采集器(在户外,是一台物理设备)通过网络组播方式将采集到的音频传送给运行在HCI中的虚拟机(win10系统)播放音频声音不定时卡顿导致即将上线项目推迟,如下图所示,在虚拟机接收音频卡顿是对应的音频条也是卡住的状态
三、故障排查步骤及对应结果 1、同环境接口同电脑操作系统版本测试物理机正常虚拟机播出的声音卡顿
2、将物理电脑接到业务交换机上面连音频采集器播放正常
3、音频采集器通过组播推流给客户端,客户端访问地址udp://XX.XX.XX.XX:9012,服务器地址XX.XX.XX.XX
4、在HCI上部署纯净虚拟机,运行在相同位置接收音频流也存在卡顿的情况,排除windows环境问题
5、在虚拟机和HCI上抓包,和物理机上面抓下来的数据包对比是一样的
6、客户开两个台站均部署HCI承载音频业务,A台站音频业务均正常,B台站音频业务卡顿,对比两台站环境如下: ①异常虚拟机是将正常的虚拟机导出之后,导入到当前环境的,虚拟机内资源占用不高,虚拟机的基础配置和正常的一致。
②虚拟机内对应抓包没有丢包音频是通过udp流传输的,通过抓包没有发现有丢包,通过纯净环境测试也有问题。
平台版本一致,主频也一致,反馈笔记本接业务交换机上测试正常
③数据包侧抓包分析,需要业务侧一同进行分析(抓包对比无问题,从数据包无法看出问题,需要重新整理思路排查)
7、在第六步排查基础上继续进行排查,对比两个台站的物理环境,从网络层面进行梳理,检查虚拟机到音频采集器中物理环境,分段进行测试,并检查网络中vlan等配置,发现虚拟机桥接到HCI的管理口,音频采集器直连到管理业务交换机的接口同vlan下没问题,之前虚拟机直接通过业务口桥接出网,到信锐交换机,接口属性为trunk all,更深入排查发现客户网络中存在较多的广播报文导致在原来物理环境下由于没有划分vlan,广播报文没有被屏蔽,导致UDP音频流量被广播报文影响,最终导致虚拟机接收到音频无规律丢失。(网络拓扑大致如下)
四、总结 1、音频码流丢失,基本上原因大致可分为虚拟机性能或配置问题、网络问题导致丢码 2、本次故障中排查了能够排查的所有配置、网络等,最终定位为虚拟机桥接网络接口属性为trunk all放通所有数据包通过,没有做vlan划分,导致客户网络中存在异常的广播风暴无法隔离,最终导致针对实时性要求较高的音频数据被大量的广播包覆盖导致码流丢失,导致了虚拟机内部接受音频卡顿丢失问题! |