故障现象: 两台vmp主机的内存利用率差不多,但是cpu利用率差很多
主控业务口eth0 IP是:192.168.6.199
排查步骤:1、查看所有虚拟机的存储位置 所有虚拟机运行位置都是均匀分布的 2、业务口也桥接了所有实体机的物理网口 3、没有发生HA,因为没有主机或者网口DOWN记录 4、使用的是动态负载 5、通过查看进程,可以看到10.254.254.252(199)上面虚拟机占用了58%的cpu,而10.254.254.251(198)上只占用了39%,这些cpu都是被正常的user进程(也就是kvm进程)所占用了。说明199上面的cpu占用多,确实是虚拟机引起的,但是为什么呢。
6、进一步查看各台主机上运行的虚拟机的数量: (1)10.254.254.251: 27台虚拟机 (2)10.254.254.252: 34台虚拟机
原因找到了:因为5.2R1版本的动态负载均衡策略是根据主机内存来的,而客户这边很多虚拟机的内存分配大小不一样,这样就导致了一台主机上运行的虚拟机数量较多,另外一台主机运行的虚拟机数量较少,所以两台主机的内存负载差不多,但是cpu负载就会差很多了。
解决办法:针对于这种情况,目前还没有太好的解决办法,建议: 1、手动将虚拟机的运行位置固定在某台主机上 2、如果觉得麻烦,可以尝试使用静态负载,但是静态负载只能在所有虚拟机开机的状态下,才能实现较为理想的负载。 |