【问题分析处理】虚拟机卡慢排查
  

zj樊迪 117083人觉得有帮助

{{ttag.title}}
常见问题及排查思路
首先,我们碰到客户反馈虚拟机卡慢的问题,我们需要收集准确的卡慢现象,利于快速定位问题。
一、基本的信息确认
1. agent状态是否正常
如果agent不正常的情况下,可以尝试重新安装下性能优化工具或者关闭防火墙,这是第一步必须要保证的过程
   2. adeskrom版本跟vdc是否匹配
      
这种情况一般出现在VDC升级后,但是盒子没有同步升级,需要在VDC里面勾选自动升级,然后让盒子接入到虚拟机去自动升级到跟VDC匹配的版本
   3. 服务器网口是否协商成千兆以上网口无复用情况出现
复用则调整网络部署,若网口协商成百兆检查服务器连接的交换机是否千兆网口并更换类或超五类网线连接。
   4. 是否ip冲突!
尤其vmp vdc地址冲突会影响所有终端,adesk虚拟机ip冲突影响个别用户
   5. 确认环境信息
设备详细版本、服务器配置、虚拟机操作系统、配置cpu核心数、内存大小、虚拟机内具体运行些什么业务、客户端类型及型号、网络拓扑,为下面的排查做铺垫
   二、低版本已知问题
1. 一体机使用9240raid卡存在随机读写性能差问题、CPU降频问题等已知问题需要打vs补丁解决
   三、确认VMP的控制台操作虚拟机会否卡顿
   Cpu模块排查
普通办公场景cpu主频不低于不低于2.1Ghz,开发环境、监控等主频不低于2.4Ghz
若跑满,检测虚拟机存储位置是否为共享存储或虚拟存储
检测集群中各主机运行的虚拟机是否均衡
   A.超配
如果运行少数几台虚拟机没有问题,开多了之后才有问题,则是并发问题了。
CPU配置情况,如上图所示,48线程X1,表示1CPU,该CPU4个核,有8线程(超线程,虚拟 机配置的1核即对应需要1个线程)假设该服务器配置2核的虚拟机,则理论上满配是4台虚拟机
如果超出这个数量,则是超配。意味着若所有虚拟机都跑满CPU的话,就会发生CPU资源争抢导致虚拟机性能下降问题。一般情况下很少会是这种情况,因为极少有虚拟机同时需要跑满或占用很高CPU的情况,除非如教学场景,同时使用某款消耗CPU的软件,如监控视频,如设计类软件。
鉴于虚拟机内部cpu跑满情况很少见,一般场景该cpu可配虚拟机核心数这样计算
8(线程数)*2.5(系数)=20核,可配置102核虚拟机。
此种情况为超配导致建议关掉不必要的虚拟机,如模板将重要虚拟机在vmp上配置为重要虚拟机。最好扩容!
B.负载不均衡
C.cpu还是忽高忽低
第三方服务器若节能模式已经关闭,降频补丁也打了还是降频建议先联系服务器厂商查硬件问题。一体机则联系400先进行初步排查定位。
   五、内存模块排查
内存跑满时先排除超配、负载不均衡原因。设备预留8G内存供vtvs、软件vdc使用,虚拟机配置内存假如是2g给虚拟机再加0.5g内存供kvm及优化虚拟机体验使用。
   六、注意事项
每台服务器需要预留至少8G系统内存,这些内存用于运行VMPVSVDC等桌面云系统组件。
每用户实际占用内存=每虚机分配内存(如上表)+0.5G,其中0.5G是用于桌面体验优化(其他厂商也需要),比如每用户分配2G内存,实际占用2.5G
   七、存储模块排查
虚拟存储
同时抽查虚拟机内部磁盘响应速度
若两者都符合则问题基本定位在虚拟存储。
   八、网络模块的排查
1确认服务器网口均协商成千兆,咱们的一体机网口都是千兆。
2检查服务器及对端交换机是否绑定速率,尝试更换六类或超五类网线。
3每个终端一般分配20M带宽,一个千兆网口满打满算带50个终端
4)盒子换跟服务器同网段的测试是否卡顿,可以通过的std200的盒子界面上是有ping命令测试
5建议带40个终端可根据客户实际情况做聚合或分流。
    九、终端模块的排查
排除外设干扰
拔掉所有外设是否有改善,有改善则参考usb外设处理方法
性能
对比测试,通过更换pc客户端、双核adesk、四核adesk、x86adesk登录虚拟机使用是否有优化
   十、虚拟机内部模块排查
个别虚拟机卡慢排查问题排查流程图
虚拟机内部操作也卡的情况下
查看是否有异常的进程占用CPU内存,进程,优先选择杀毒,再尝试添加cpu、内存资源。尝试协助安全软件比如360这种,之前碰到多次360安全软件导致虚拟机卡顿严重
虚拟机的使用场景是否为大量的io写的场景
下面的几种场景下需要按重载场景下选型
视频监控、视频会议场景(比重载更高,必须让研发参与选型)
安装了桌管软件、PC版杀毒软件、360安全卫士、文件加密软件的办公场景
需要经常访问50M以上office大文件的办公场景,比如招标书、财务大报表等
使用eclipsevisual stutioandroid studio等软件的研发场景
PhotoShop场景
高校职教和企业的2D设计场景

打赏鼓励作者,期待更多好文!

打赏
27人已打赏

南小卒 发表于 2020-11-30 01:10
  
楼主分享的资料详尽详实,对于问题的处理基本方法和思路都分享了,值得大家日常知识巩固,感谢楼主分享
颜任杰【浙江】 发表于 2020-11-16 14:11
  

回帖奖励 +8

优秀,学习了
Sangfor_闪电回_朱丽 发表于 2020-11-17 10:35
  

回帖奖励 +8

感谢楼主带来的经验分享,文章已被收录到技术博客中,以便让更多的用户关注和学习!

社区有奖征文活动正在进行,发布技术笔记和原创分享,均有奖励!欢迎投稿,活动详见:
http://bbs.sangfor.com.cn/forum.php?mod=viewthread&tid=127729
collid 发表于 2020-11-17 12:00
  

回帖奖励 +8

感谢分享
sangfor_闪电回_小六 发表于 2020-11-18 09:39
  

回帖奖励 +8

评论是对作者最大的鼓励! +8 S豆 详情>

楼主分享的案例很实用,具有典型性,希望有更多这样的干货供我们学习参考,非常感谢!
沧海 发表于 2020-11-18 09:43
  

回帖奖励 +8

楼主从各个方面详细解释了虚拟机卡慢的原因和解决方法,思路清晰,学习了
zzvc007 发表于 2020-11-18 10:27
  

回帖奖励 +8

打卡学习,感谢分享
新手967919 发表于 2020-11-18 11:07
  

回帖奖励 +8

评论是对作者最大的鼓励! +8 S豆 详情>

感谢楼主带来的经验分享
您已经被移除深信服社区 发表于 2020-11-18 14:52
  

回帖奖励 +8

先收藏一波                  
好心情 发表于 2020-11-18 21:59
  

回帖奖励 +8

排查思路清晰,非常好
发表新帖
热门标签
全部标签>
技术盲盒
每日一问
安全效果
干货满满
西北区每日一问
新版本体验
技术笔记
【 社区to talk】
功能体验
技术咨询
标准化排查
产品连连看
2023技术争霸赛专题
GIF动图学习
信服课堂视频
每周精选
自助服务平台操作指引
秒懂零信任
技术晨报
技术圆桌
通用技术
答题自测
安装部署配置
原创分享
玩转零信任
场景专题
升级&主动服务
社区新周刊
POC测试案例
畅聊IT
专家问答
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
排障笔记本
产品预警公告
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
2024年技术争霸赛
北京区每日一练
故障笔记
排障那些事
高手请过招
高频问题集锦
全能先锋系列
云化安全能力

本版版主

468
227
32

发帖

粉丝

关注

7
11
24

发帖

粉丝

关注

5
7
7

发帖

粉丝

关注

31
34
45

发帖

粉丝

关注

本版达人

新手89785...

本周建议达人

YangZhe...

本周分享达人

runner

本周提问达人