本帖最后由 85039王毅波 于 2024-8-6 20:59 编辑
背景:客户云桌面版本5.5.3R2,VS版本2.8.1_R9
一、问题:50多台云桌面虚拟机黑屏(客户一共800多台)
二、现象:部分虚拟机黑屏(随机分布在多台服务器主机上面):用户端接入也是黑屏、从VMP管理端打开后显示未知硬件错误。
VMP管理端查看黑屏虚拟机部分显示"Unknown Hard Error"
用户端通过盒子登录云桌面后,只能看到中间上方延迟多少毫秒,但是看不到虚拟机画面。
PS:部分虚拟机用户端盒子登录黑屏,从VMP后面点击进入对应虚拟机控制台后虚拟机显示正常,然后用户端盒子接入瞬间就显示恢复正常。
1、建议先按照智能客服或者社区BBS案例来排查:
https://bbs.sangfor.com.cn/plugin.php?id=case_databases:note_detail¬e_id=26525
2、本次问题原因是由于虚拟存储-高级设置-数据平衡计划配置了但是未生效,导致部分主机数据盘利用率跑满:利用率100%,但是部分磁盘利用率为0,严重不均衡。
3、本次问题原因:虚拟机名称包含中文,VS2.X的版本会存在偶发性的数据平衡不生效问题。
解决办法以下4种:
a、改代码编码格式默认为ASCII 码格式,与zk 配置的utf-8 格式不符导致
b、重启vs_tasks进程 /sf/vs/etc/init.d/vs-tasks restart【执行此命令前请跟研发确认后再操作】每台主机都要执行;
c、根本解决办法是升级二合一版本
d、使用adesk-tools里面的磁盘数据平衡功能进行平衡。这个比较慢,9个小时只平衡了800G左右,平均每秒不到30M。不着急可以用这个
目前业务相当丝滑,再未出现蓝屏问题。 PS:大家处理问题的时候,最好同步跑下巡检,巡检结果很多时候也能给我们方向和解决办法。滴滴滴 |