常见问题及排查思路 首先,我们碰到客户反馈虚拟机卡慢的问题,我们需要收集准确的卡慢现象,利于快速定位问题。 一、基本的信息确认 1. agent状态是否正常 如果agent不正常的情况下,可以尝试重新安装下性能优化工具或者关闭防火墙,这是第一步必须要保证的过程 2. adesk的rom版本跟vdc是否匹配 这种情况一般出现在VDC升级后,但是盒子没有同步升级,需要在VDC里面勾选自动升级,然后让盒子接入到虚拟机去自动升级到跟VDC匹配的版本 3. 服务器网口是否协商成千兆及以上网口,并无复用情况出现 复用则调整网络部署,若网口协商成百兆检查服务器连接的交换机是否为千兆网口并更换六类或超五类网线连接。 4. 是否有ip冲突! 尤其是vmp vdc地址有冲突会影响所有终端,adesk或虚拟机ip冲突仅影响个别用户 5. 确认环境信息 设备详细版本、服务器配置、虚拟机操作系统、配置的cpu核心数、内存大小、虚拟机内具体运行些什么业务、客户端类型及型号、网络拓扑,为下面的排查做铺垫 二、低版本已知问题 1. 一体机使用9240raid卡存在随机读写性能差问题、CPU降频问题等已知问题需要打vs补丁解决 三、确认VMP的控制台操作虚拟机会否卡顿 四、Cpu模块排查 普通 办公场景cpu 主频不低于不低于2.1Ghz ,开发环境、监控等主频不低于2.4Ghz
若跑满,检测虚拟机存储位置是否为共享存储或虚拟存储 检测集群中各主机运行的虚拟机是否均衡 A.超配 如果运行少数几台虚拟机没有问题,开多了之后才有问题,则是并发问题了。 CPU配置情况,如上图所示,4核8线程X1,表示1个CPU,该CPU是4个核,有8线程(超线程,虚拟 机配置的1核即对应需要1个线程)。假设该服务器配置2核的虚拟机,则理论上满配是4台虚拟机。 如果超出这个数量,则是超配。意味着若所有虚拟机都跑满CPU的话,就会发生CPU资源争抢。导致虚拟机性能下降问题。一般情况下很少会是这种情况,因为极少有虚拟机同时需要跑满或占用很高CPU的情况,除非如教学场景,同时使用某款消耗CPU的软件,如监控视频,如设计类软件。 鉴于虚拟机内部cpu跑满情况很少见,一般场景该cpu可配虚拟机核心数这样计算 8(线程数)*2.5(系数)=20核,可配置10台2核虚拟机。 此种情况为超配导致建议关掉不必要的虚拟机,如模板。将重要虚拟机在vmp上配置为重要虚拟机。最好扩容! B.负载不均衡 C.cpu还是忽高忽低 第三方服务器若节能模式已经关闭,降频补丁也打了还是降频建议先联系服务器厂商查硬件问题。一体机则联系400先进行初步排查定位。 五、内存模块排查 内存跑满时先排除超配、负载不均衡原因。设备预留8G内存供vt、vs、软件vdc使用,虚拟机配置内存假如是2g给虚拟机再加0.5g内存供kvm及优化虚拟机体验使用。 六、注意事项 每台服务器需要预留至少8G系统内存,这些内存用于运行VMP、VS、VDC等桌面云系统组件。 每用户实际占用内存=每虚机分配内存(如上表)+0.5G,其中0.5G是用于桌面体验优化(其他厂商也需要),比如每用户分配2G内存,实际占用2.5G 七、存储模块排查 虚拟存储 同时抽查虚拟机内部磁盘响应速度 若两者都符合则问题基本定位在虚拟存储。 八、网络模块的排查 1)确认服务器网口均协商成千兆,咱们的一体机网口都是千兆。 2)检查服务器及对端交换机是否绑定速率,尝试更换六类或超五类网线。 3)每个终端一般分配20M带宽,一个千兆网口满打满算带50个终端。 4)盒子换跟服务器同网段的测试是否卡顿,可以通过的std200的盒子界面上是有ping命令测试 5)建议带40个终端,可根据客户实际情况做聚合或分流。 九、终端模块的排查 排除外设干扰 拔掉所有外设看是否有改善,有改善则参考usb外设处理方法 性能 对比测试,通过更换pc客户端、双核adesk、四核adesk、x86adesk登录虚拟机使用是否有优化 十、虚拟机内部模块排查 个别虚拟机卡慢排查问题排查流程图 虚拟机内部操作也卡的情况下 查看是否有异常的进程占用CPU内存,进程,优先选择杀毒,再尝试添加cpu、内存资源。尝试协助安全软件比如360这种,之前碰到多次360安全软件导致虚拟机卡顿严重 虚拟机的使用场景是否为大量的io写的场景 下面的几种场景下需要按重载场景下选型 视频监控、视频会议场景(比重载更高,必须让研发参与选型) 安装了桌管软件、PC版杀毒软件、360安全卫士、文件加密软件的办公场景 需要经常访问50M以上office大文件的办公场景,比如招标书、财务大报表等 使用eclipse、visual stutio、android studio等软件的研发场景 PhotoShop场景 高校职教和企业的2D设计场景
|