本帖最后由 adds 于 2017-1-7 17:55 编辑
故障现象总结: a0001无法启动;a0003报系统注册表文件丢失或损坏;a0005报磁盘读错误;a0007、booo3、b0009、d0002报丢失操作系统;d0003报磁盘不存在;d0006报虚拟机异常关机。
图片1:a0001--HA启动虚拟机;虚拟机异常关机。
图片2:a0003--系统注册表文件丢失或损坏。
图片3:a0005--a disk read error occured
图片4:a0007、b0003、b0009、d0002--Missing operating system
图片5:d0003--磁盘不存在
图片6:d0006--启动虚拟机;虚拟机异常关机
VMP系统版本:4.9。 虚拟机蓝屏、黑屏、资源管理器崩溃的情况遇到过,但一般是小概率事件,像这种群体性、大面积的启动异常现象还是第一次遇到。 根据现场第一手资料,我做了个假设:会不会是这一个班级的学生不好好上课,上课搞事情了? 他们有可能是这样想的: 于是,我把我的猜想告诉了客户,客户当头给我一棒:这个机房你们安装后,没有学生上课。 这是我当时的表情,(因为我没有想到2个月了,竟然没有人上课,你们拿我的劳动成果当摆设吗?) 好吧。会是什么原因呢?日志里没有告警日志啊?现在是问题不一致,不知道从哪个方向入手? 前面不行,那从后面走吧。于是,我拨打了400-630-6430,也就是从打了这个电话后,事情的发展方向变得不可控了。 从上午10点59分开始,我的电脑就处于受控状态。 一开始,我还盯着电脑,看那些代码在那儿闪啊闪的,后来,我实在拼不住研发的耐力,毕竟人家是正规军,咱是野战军,第一次在客户现场有了睡意。还好,没睡着,不然,肯定感冒了。 情况一直持续到下午5点,我看屏幕不动了。我点了点虚拟机,发现OK了。于是电话400,问问情况。400说,研发还没给他反馈,稍后会给我答复。我说不急啊,有信儿了发我QQ就成。 其实我的是内心是崩溃了,搞了我的电脑一整天,一句话不说就走了,我的电脑怎么想?客户怎么想?晚上我怎么写外出报告?
第二天早上,我被400的电话叫醒,我一个激灵爬起来,心想,400办事还挺快,没等周一就把问题清楚了,值得表扬,回头得整个锦州送过去。 他当时是这么说的,你们来体会下:
知道我当时的心情吗?
终于,问题的原因找到了。很简单,简单到你想不到。机房断电导致服务器内的虚拟机配置文件损坏或丢失,导致虚拟机开机出现各种问题。这是4.6版本之后的版本出现这种问题的原因。如果本身是4.6或4.6之前,系统本身就有可能出现这些问题。
另外,十分感谢帮我处理问题的400。谢谢,没有你们,昨天的故障,我是肯定找不到原因的。
Get 技能:虚拟机的VMP操作系统默认占用主机8个G的内存资源,这8G不仅给VMP,还包括VDC、VS。如果没有VDC和VS,VMP一般占用到4个G。 |