本帖最后由 85039王毅波 于 2024-7-25 12:24 编辑
记一次云桌面问题处理
一、问题:客户反馈有两台虚拟机进入windows后会自动卡死,什么也动不了;windows关机也会卡死几十分钟关不掉,滴滴滴。
二、排查过程:下午协调集成提供客户现场远程,登录上去排查: 复现&确认问题现象:4和3那台有问题的虚拟机上去看了,确实每次过6分钟左右就直接卡死,用户端和管理端控制台进入均卡死,无法操作,后台显示CPU利用率100%,资源从3C4G扩容至8C16G,仍然一样,重启五次,现象一样。目前已解决,下午排查和操作均与客户沟通后进行的:
1、检查VMP平台资源利用率,没有完全满载,虚拟机确实在卡死的时候,CPU会自动干到100%,怀疑是中毒了。
2、检查VMP和VDC相关日志,平台上没有异常(agent等)。
3、进入虚拟机复现现象,检查任务管理器里面CPU和内存、磁盘利用率,发现CPU自动会跑到100%导致卡死无法操作。
4、进入系统安全模式,没要到客户windows密码,没进行下去。
5、与客户沟通后,卸载43这台虚拟机360杀软和360壁纸,关闭非必要开机启动项(msconfig)(只保留windows和火绒)、同时安装火绒进行查杀。观测25分钟,不再卡死。重启也是OK的。
三、问题排查过程中发现一些问题,建议(已同步市场&对应合作伙伴):
1、客户目前就一台服务器主机,目前运行48台虚拟机,高峰期运行61台,CPU利用率在81%以上,存在资源瓶颈。建议尽快扩容。 2、客户维保过期(2020-11-27-2023-12-27),建议及时跟进。 3、持续闭环客户历史产品&服务满意度风险。
OVER
|