本帖最后由 99628 于 2023-11-6 23:14 编辑
一、背景
客户桌面云VDI停止服务,尝试VDC(5.4.5R1)控制台拉起无效,客户尝试重启VDC,VDC重启后控制台可以正常打开但无法登录,控制台持续加载且无报错。 二、问题排查 1.清除浏览器缓存重新尝试登录,无效 2.打开浏览器无痕模式登录,无效 3.通过admin账号进入VDC后台,进行sudo su提权进入root,密码错误无法登录 4.执行vim /hislog/shellcall.txt按G到末页查看日志 5.根据以上日志,执行journalctl -u sangfor-apache查看Apache服务 6.执行systemctl status sangfor-apache,Apache状态异常 7.由于VDC异常导致VDI资源无法使用,客户业务异常需要快速拉起业务,再次尝试重启VDC后仍然无法正常拉起服务 8.查看VMP中的VDC备份文件,尝试通过恢复备份恢复VDC正常,但是由于客户无备份策略上一次备份时间很久,无法在保证配置不变的情况下完全恢复正常,得到客户许可后将目前状态VDC备份后恢复旧备份,发现VDC可以正常使用但是配置缺失。 9.尝试VDC导入配置文件恢复配置,但是此集群VMP无法导出
10.重新恢复备份到故障VDC,进入后台进入/sf/cfgbackup/导出最近VDI配置文件,进入/sf/log/blackbox/目录取出黑匣子文件,进入/sf/log/daemon目录取出目录下文件,再次恢复备份到旧VDC 11.在VDC控制台中恢复VDI备份文件,查看VDI状态正常,客户验证业务正常 12.对VDC进行巡检,状态正常;将旧VDC打好最新安全加固包,向授权同事黄建正申请0授权序列号后,组建VDC集群,并在VMP中配置备份策略保证备份实时更新 三、问题根因 执行重启操作(高危操作)前应先提醒客户做好备份;该问题具体原因研发同事正在排查后续实时更新 |