【问题现象描述】
1、客户反馈超融合 6.3.0R1 版本,三台主机组建的集群,一共两个集群,一个部署在深圳一个部署在香港,香港早上开会用户反馈画面延迟比较严重,要求我们排查。 【问题处理过程】 1、 查看香港访问外网的延迟,深圳ping香港网关的延迟,都比较严重,延迟在200ms左右 2、将超融合的业务交换机和核心之间网线拔掉,深圳ping香港延迟正常 3.将超融合修改IP网段,修改vlan,香港这边网络延迟依然严重,把超融合网线拔出后,香港网络延迟现象依旧。 4、深圳ping香港192.168.25.2网关不通,怀疑是专线没有这个路由,目前不清楚专线路由如何做,所以将IP网段和vlan改回192.168.0.0/24网段,重新ping香港网络,可以ping通,但延迟现象依然存在,怀疑不是IP网段或者vlan的问题,香港此时的网络是正常的,可能是专线带宽被占满,登录到云管平台,看到异地容灾有五个处理进程,但是因为带宽不足,无法正常做灾备,所以进程一直存在。将传输速度限制在1Mpbs后,深圳这边重新ping香港延迟;正常,香港ping网关,正常。 【问题原因分析】 1、ZOOM会议延迟问题,应该是由于运营商网络问题,导致延迟,目前香港上网正常,深圳ping香港网络延迟问题,是由于深圳和香港的超融合需要做异地灾备,又因为两地之间的带宽只有10Mbps,无法满足正常灾备的需求,备份过程中,两地的专线被灾备的数据占满导致ping延迟。 【解决方案】 1、首先解决异地灾备首次全量备份问题,目前可以利用一块或多块外置硬盘,将云管平台的种子文件以导出导入的方式,把深圳这边的云主机数据导出到外置硬盘,然后发往香港,把硬盘接到香港的超融合存储上,再用香港的云管把硬盘的种子文件导入到香港超融合集群,如一块硬盘存储不了这么多数据,可以用多块硬盘,分别存储不同虚拟机的数据。导入完成后可以在香港超融合上看到灾备的虚拟机。 2、后续的增量备份,可以观察平台每天新增的增量数据,安装这个数据以及每天每天备份用的时间,算出需要做灾备的带宽,比如带宽需要20Mbps才支持完成每天正常的备份,则带宽建议提升到20Mbps及以上。 |