×

#原创分享#记一次超融合服务器临时停电后的应急处理
  

liugd1013 2723人觉得有帮助

本帖最后由 liugd1013 于 2020-1-16 01:31 编辑

      假期中,各种通知的效率都比较低,当接到临时停电通知的时候,UPS的电量已经消耗了一大半,这种情况一年也遇不到一次,赶上了还真是有点棘手。一百多台服务器,每台都正常关机已经是不可能了,但是剩下的时间也不能浪费了,在能力范围内做一点补救措施吧。
      先抢救数据吧,有好几个Web应用系统,为了避免关机的时候有新的数据产生,干脆直接将内网域名解析的Nginx服务停掉。

333075e1f4b1457cfd.png

      在正常情况下,遇到需要关机的时候,我都会先做个快照,防止再次开机的时候遇到各种未知问题,但是快照管理的操作有点繁琐,当前的情况肯定是来不及了。

5695e1f4b23a9933.png

    还好我之前对所有的服务器都配置过自动备份的策略

3.jpg

  在本地备份路径下,可以选中所有的策略,然后选择立即备份。接下来就等着备份完成吧,这步操作还是比较顺利的,有了这些备份,也让我安心了许多,不得不说,深信服的超融合在这个操作方面做的还是挺便利的,同时在用的VMware就只能手动每台做快照了。

205935e1f4b96e5a11.png

备份顺利完成后,看了下日志,还是发现了一点小意外。

9345e1f4ba16b15f.png

  发现了两条失败的记录,而且虚拟机的名称是一串看不懂得字符。这个小插曲让人心里很不舒服,看看任务详情吧。原来是云主机不存在。

462335e1f4bab143c0.png

  到底是哪台云主机不存在了?就算是不存在了,你改这名一长串字符,我哪能想起来是哪台呢,这种情况最好是能记录一下原主机名和所在的策略。还好我这建的策略不多,点编辑看一看吧。
659305e1f4bb5ab92f.png

  最后还是找到了,有一个策略当时选择了5个云主机,点击查看云主机后,发现选中的云主机只有3个,后来想起来了,有两个云主机删除了,但是备份策略没有修改。

730145e1f4bc1c44ef.png

接下来不啰嗦了,选中所有的服务器,然后点关机,这么爽的操作,你试过吗?

111.jpg


喜欢这篇文章吗?喜欢就给楼主打赏吧!

打赏
6人已打赏

71415 发表于 2020-1-16 17:11
  

你的19年度榜单已开启 +6 S豆 详情>

可以,可以厉害,厉害了。
sdhd_耿建峰 发表于 2020-1-16 21:47
  
学习了,感谢分享
心灵鸡汤 发表于 2020-1-17 07:59
  
这波操作有点爽
YangZheng 发表于 2020-1-17 08:32
  

学习了,感谢分享
暖暖的毛毛 发表于 2020-1-17 10:26
  
又学到了新技能!
新手942987 发表于 2020-1-18 08:15
  
厉害了,又学到了新技能!向楼主学习!
厌児 发表于 2020-1-18 17:33
  
为楼主点赞,希望楼主多多分享干货!
新手741261 发表于 2020-1-18 22:50
  
这操作意向不到