6.7出来好久了。一直想升级,升级前准备工作也做了很多,咨询在线客服什么的,安排在晚上升级,晚上8点多,巡检,上传升级包都没问题,然后提示冷升级。。结果确认重启后,20分钟过去了,1个小时过去了,还一直PINGi不通设备,因为我在家里是远程登入到机房设备进行升级的,所以我看不到界面,一直PING设备。有种不好的预感 ,估计 设备没起来。。这么晚了也没办法 联系厂家,只能遨到天亮,一夜没睡着,第二天6点不到就到了单 位机房,联系了实施方,实施方说帮我找人,后来是找到了技术 ,一起远程看,直到10点左右,他说要调用研发技术一起看,后来估计 厂家也上班了,群里进来了美女技术,一直远程排查。期间我的电话已经被业务单位给打爆了,我也急啊,直到下午2点不到,系统是能进了,后来又发现业务用不了。。排查了好久,业务系统是能上了,但是有台主机一直掉线状态 。
目前为止先将就用着,等下周再具体排查原因。
【问题背景】 3主机一体机集群,升级至670R2后,重启主机卡住,影响业务 【当前进展】 1、拔掉三台主机的eth4口网线后,集群主机都正常启动,于13:10集群稳定 2、虚拟机运行在217主机网络会不通,已经通过选择启动位置为216 218 先恢复业务,业务于14:30 恢复 3、当前虚拟机都运行在216 218主机上 3、排查后台日志发现是一直卡在 执行 /etc/rc2.d/S161vs-startup start, vs同事yw认为卡住的原因是存储私网配置没有配置成功,直到eth4被拔后才配置成功 【遗留问题】 1、当前217主机管理口不通(管理口 eth0 eth4 聚合,当前eth4 未插线),初步排查是物理网络有问题 2、主机启动卡住的原因要进一步分析是什么原因导致存储网没有配置成功 3、运行在217主机上的虚拟机网络不通的问题待查 【下一步计划】 1、需要客户先确认一下物理网络环境是否有问题—-客户 2、排查遗留问题,重点是主机启动卡住原因,后续是否还会有启动卡住风险——-400和研发 |