本帖最后由 99628 于 2024-3-9 09:40 编辑
一、项目背景 XX客户在一次沟通中询问,我司是否有一个平台或工具可以检测超融合平台中的占用资源但长时间并不使用的主机,一开始想到的是IOM,但是IOM无法检测超融合主机;于是便想到了aOPS(运维中心),其中一项功能为空闲主机监测。
二、产品简介 深信服运维管理平台aOPS是一个集物理设施监控、操作系统监控、中间件监控、虚拟资源的生命周期管理、运行监控、操作维护于一体的运维管理平台。能够实现跨数据中心的统一CMDB,将数据中心所有的资源资产全部管理起来;实现基于CMDB的跨数据中心资源监控、告警;汇聚海量运维、运营数据,支持大规模统计、分析。(注:该产品截止1.2版本已全部停止维护) 三、产品特点 1. 机房可视化:沉浸式可交互的3D大屏,虚拟化真实的现实视觉效果,让用户体验在线机房运维管理,如:业务告警定位、机架容量查看、设备故障巡检等。无论是日常的机房巡检,还是上级不定期的汇报参观,都能有身临真实数据中心的感受。 2. 虚拟机空闲识别:摒弃粗暴的静态阈值判断方案,基于深信服专家及多年托管运维经验,并结合先进的机器学习算法识别模型自动适配,模型的适用面广,同时,操作简单友好。 四、产品部署 注:aOPS部署分为传统网络与VPC网络,常规情况下使用传统网络即可。 五、注意事项 1.aOPS需要和SCP对接后,进行同步,才能获取到云主机的信息 2.云主机状态监测的前提是安装agent(只有HCI平台的虚拟机支持一键安装agent) 3.处于关机状态和未安装vmtool的主机无法一键安装agent,云主机端口8081和8888未开放,可能导致数据无法上传 4.agent安装很方便,但是无法一键卸载。 5.680以上版本HCI部署aOPS可能遇到平台无法正常创建数据中心等一些列错误(报错为:未知错误,请联系技术支持处理),可以在aOPS后台执行以下命令解决: systemctl restart cmdb-init-conf
systemctl restart cmdb-init-data systemctl restart cmdb-* |