【2022争霸赛*干货满满】深信服桌面云智能运维平台IOM原理以及新老版本差异对比和升级指导分享
  

山东_朱文鑫 38772人觉得有帮助

{{ttag.title}}
本帖最后由 山东_朱文鑫 于 2022-10-8 22:16 编辑

大家好,我是大白,正所谓博观而约取,厚积而薄发。优质的帖子也在尽力中提供,也希望各位道友多多支持,让我引劫渡劫成功哈哈哈。

大白队口号就是:砸锅卖铁我最行,拼死拼活就要赢!!!!!!!!!!!!

今天技术分享的是深信服桌面云智能运维平台IOM原理以及新老版本差异对比和升级指导分享,之前我们已经发了IOM平台的部署信息以及部署方式,对于深信服桌面云智能运维平台IOM的出现,弥补了桌面云虚拟机集中运维的监控的空白,其炫酷的UI也引来较多童鞋额的兴趣,那么今天再讲一下深信服桌面云智能运维平台IOM的原理。

IOM深信服桌面云运维平台:

因为IOM从1.0.0升级1.1.0以后叫做IOMPlus,以下我们就以IOMPlus进行说明。

IOMPlus是什么?

      深信服IOMPlus-VDI智能运维平台,提供业界领先的VDI性能诊断方案,可以侦测并 发现50%以上的VDI卡慢问题,并按需提供优化解决方案。该系统结合智能算法等前 沿技术,囊括了应用、网络、存储、虚拟机、物理机等体系的运维解决方案,实现VDI 性能问题的快速排查,7*24小时不间断智能分析桌面云卡慢情况,提供全方位的优化 解决方案。

      深信服IOMPlus-VDI智能运维平台本质上是一个针对VDI云服务全景立体化的智能监 控-智能告警-智能分析-智能优化建议的全生命周期运维管理平台。核心思想是:发现 问题、定位问题、分析问题、解决问题。

IOMPlus有什么作用体现?

1. IOMPlus强大的采集能力能够实现VDI全栈跨应用、虚拟机、物理机等层级的监控;

2. IOMPlus结合业界领先的VDI性能诊断经验,可以自动监测并发现VDI卡慢问题;

3. IOMPlus结合自研智能分析算法和产品配置,可以自动针对监测到的VDI卡慢问 题输出问题解决建议和优化配置建议;

4. IOMPlus结合自研智能分析算法和专家领域经验,可以针对VDI的资源配置问题 提供建议,实现降本增效。

IOM的使用场景是什么?

1. 被动排障场景:用户反馈卡慢问题后,客户IT管理员、技术工程师使用IOMPlus 对客户卡慢问题做初步排查;

2. 主动巡检场景:客户IT管理员、技术工程师定期使用IOMPlus平台对桌面云平台 进行检查,查看是否存在卡慢问题,发现卡慢问题时可以及时进行处理,无需等 到用户投诉后再处理;

3. 技术支持排查场景:用户反馈卡慢后,客户IT管理员,技服工程师使用IOMPlus 的智能分析对客户卡慢问题做初步排查后,依旧无法解决卡慢问题,需要研发专 家接入排查。

IOM原理说明:

IOM系统由IOM服务分析平台(运行在虚拟机或物理机上)、IOM展示控制台(WebUI) windows虚拟机Pagent采集器VMP主机Pagent采集器组成。通过Pagent详细采集 虚拟机中的相关信息,并结合IOM自身的智能分析算法,监控和分析虚拟机、平台的 相关问题,并给出对应的解决和优化建议。

总结一句话就是帮你去分析去解决问题,为你解决问题提供建设性建议。


IOM搭建需要准备的信息:

1.VMP平台从5.4.10R1版本开始,VMP支持直接对接IOM平台,同时VMP上运行的虚拟机可自动对接IOM平台。VMP版本必须为5.4.10R1及以上

2.Centos7物理机&虚拟机承载IOM平台,在centos中进行IOM的安装,作为IOM的管理平台。目前只支持在Centos上部署。如在其他linux其他发行版部署出现稳定性问题均不负责处理。为避免IOM额外占用VMP的资源,建议使用物理机部署IOM平台。建议Centos7及以上版本进行安装

3.IOMPlus安装包IOM组件的安装包,在centos虚拟机内可以通过安装脚本进行一键安装。

4.PagentPagent是信息采集器,需要安装在用户的虚拟机内,以及VMP系统内,从而对虚拟机进行监控。从5.4.10R1版本开始已经集成在agent内部,且该版本VMP已经自带pagent,无需安装。

5.Shell工具IOM安装过程中需要将安装包上传到centos虚拟机内,并进行相关的安装,需要使用shell工具。如pshell、xshell、mobaxterm等等

需放通 IOM 与 VMP、虚拟机之间网络的 9563 和 8023 端口。

1. 受IOM监控的虚拟机:虚拟机通过Pagent将采集数据上传至IOM平台(IOM端监 听9563端口);

2. 受IOM监控的VMP平台:VMP通过Pagent将采集数据上传至IOM平台(IOM端监 听9563端口);

3. 管理员的PC:管理员使用PC通过网络访问IOM的控制台(IOM监听443端口);

4. 所有监控对象Pagent升级:虚拟机和VMP的pagent升级通过网络连接IOM服务器 进行(IOM端监听8023口)。

网络要求:

安装了Pagent的虚拟机(即受监控的虚拟机)要实时向IOM上报流量信息,每台虚拟 机的实时流量为0.0256Mb/s。

如:假设一台服务器上运行50台虚拟机,则此台服务器的物理网口所需带宽为1.28Mb, 若是1000Mb的物理网口,相对来说带宽占用较少;对于IOM平台来说,若同时监控 1000台虚拟机,则IOM服务器所需业务带宽为25.6Mb,若是1000Mb的物理网口,相对来说带宽占用较少。

IOM针对对接的虚拟机数量的不同配置要求也不一样:


说明:

1. IOM平台所需磁盘容量中有50G是IOM系统安装所需容量,余下空间为数据容量要求;

1. IOM数据只保留最近的15天;

2. 要保持较好体验,内存建议16GB起步,如果资源允许,建议多分一些内存和磁盘空间;

3. IOM目前支持接入机器数量上限为10000台,但基于稳定性与数据展示美观性等 情况,仍然建议在大规模接入场景分两台IOM进行业务承载。

4. 如使用独立物理服务器进行部署,建议使用全闪,以获得更好的运维体验。

5. IOM每天收集的数据量如下(以单台受监控的虚拟机为例):
       数据条数为 40 万(进程 18 万);
       占用 IOM 服务器磁盘空间为 25MB;
       每台受监控虚拟机的实时网络流量为 0.0256Mb/s。

存储影响:

于IOM平台需要收集和写入大量的数据,所以对于IOM所使用的存储资源性能有所影响,仅考虑SSD(机械盘的影响可忽略不计),详细情况如下: 【为避免IOM平台额外占用VMP平台的相关存储性能,推荐使用额外的物理机单独部 署IOM,若需要使用虚拟机部署IOM,则请详细查看下列信息进行评估】

1. VS虚拟存储影响:评估是最坏情况在原VS IO读写量不变的情况下,额外增加 IOM的日志写入量,且只影响IOM部署的单台VMP主机上的VS-SSD缓存盘):

     500 台虚拟机 IO 写入量 25M*500=12.5G/天,对 SSD 寿命影响约 0.5%

     1000 台虚拟机 IO 写入量 25M*1000=25G/天,对 SSD 寿命影响约 1%

     2000 台虚拟机 IO 写入量 25M*2000=50G/天,对 SSD 寿命影响约 2%

     3000 台虚拟机 IO 写入量 25M*3000=75G/天,对 SSD 寿命影响约 4%

*运行 IOMplus 服务器的 VMP,其上面的虚拟机会比其他的 VMP 主机少很多,所以虚拟机本身的写磁盘 IO 会少很多,真实压力会比上述评估的好很多(上述影响评估是最悲观, 保险起见可以迁移 IOM 服务器运行位置,减少对单台 VMP 上的 SSD 寿命影响)

2. 本地存储影响:(机械盘影响不计,仅考虑SSD)SSD存储空间越大,IOM虚拟 机数据写入影响越小,正常分配存储空间足够用5年左右

新老升级指导:

老版本1.0.0升级之前无必要要求,需要协调好升级窗口时间,升级前建议备份好原IOM的虚拟机进行快照,整个升级 时间为大约为30min,升级pagent大约5s-30s升级一个为避免广播风暴会进行错峰升级。

升级方式:

1. 登录到智能运维平台IOM1.0,在界面确定版本为1.0,输入账号密码,进入主界面:


2. 在主界面点击[系统设置/系统升级],进入升级界面,点击[立即升级]。


3. 点击上传升级包,将升级包上传开始进行升级。


4. 升级完成后,IOM将自动重启所有服务。等待10-15分钟,手动刷新浏览器,待 重启后并正常到达主界面,在主界面确认版本是否已经正常升级到IOM1.1。


新老版本对比:

UI界面:



自带平台介绍,帮助使用人员更加了解IOM的各种能力。



新功能:


闲置虚拟机识别:







通过AI算法结合专家经验分析过去7天的虚拟机运行数据,自动识别出闲置的虚拟机,并智能估算出其资源占用及优化后资源节省具体值。回收这些闲置的虚拟机,有利于保障集群内资源稳定,避免不必要的开销。

待优化软件识别:





管理员可以通过IOMplus方便快速的找出集群环境、虚拟机环境发生的变化,能快速定位因虚拟机配置变化、业务软件变化和新增流氓进程导致的卡慢问题。并且可以根据用户实际场景对软件列表进行添加或删除。

可新增虚拟机:





能方便了解集群环境虚拟机负载分布,预估服务器硬件资源合理扩容详情,还能灵活自主的指定虚拟机配置和台数来预估。保障虚拟机配置规划合理,集群资源利用率高,用户体验良好。



待迁移虚拟机推荐:



关注首页及智能分析中待迁移虚拟机算法输出结果,定期主动运维批量处理待迁移虚拟机,保障集群环境资源平稳,主动解决部分主机超载导致的卡慢问题。



通过AI智能算法结合专家经验规则分析统计过去7天的历史数据,推荐出可以减配的虚拟机列表,并智能估算出其资源占用及优化后资源节省具体值。合理配置虚拟机资源可以让集群运行更流畅,减少不必要的管理开销,虚拟机资源利用更合理。

可减配虚拟机推荐:



通过AI智能算法结合专家经验规则分析统计过去7天的历史数据,推荐出可以减配的虚拟机列表,并智能估算出其资源占用及优化后资源节省具体值。合理配置虚拟机资源可以让集群运行更流畅,减少不必要的管理开销,虚拟机资源利用更合理。





通过AI智能算法结合专家经验规则分析统计过去7天的历史数据,能高效准确的识别出哪些虚拟机配置过低,并给出最佳扩容方案细节,推荐出待扩容的虚拟机列表。根据集群最佳体验容量和主机负载情况,推荐待扩容分布。根据智能扩容建议,能在最低成本线(人力排查成本、资源成本),提升虚拟机体验。

邮件告警:



支持对接邮件服务器,支持自定义配置告警等级。(需定制支持)

OpenSDK对接:



功能优化项-支持列表\报告导出





功能优化项-虚拟机用户字段



功能优化项-重要虚拟机标记



功能优化项-处置建议优化



功能优化项-专有名词注释优化





功能优化项-磁盘IO对比优化



以上就是本次的深深信服桌面云智能运维平台IOM原理以及新老版本差异对比和升级指导分享,以上就是IOM平台的信息,建议大家踊跃的试用一下,感谢大佬们的参阅,此贴先到这里后续会带上更加实用的帖子,感谢大家!

励志分享超清壁纸语句~~:



读书无疑者,须教有疑,有疑者,却要无疑,到这里方是长进。——朱熹


好的今天就到这里,老样子,感谢各位大神的参阅,孩子为了挣豆子不容易,孩子家里穷没豆子吃饭了!!!

打赏鼓励作者,期待更多好文!

打赏
2人已打赏

七嘴八舌bar 发表于 2022-10-10 18:48
  
专家点评:文章介绍了IOM的部署注意事项及相关功能,但大部分属于部署文档的内容,期待楼主更多分享!
小丁同学 发表于 2024-8-6 16:45
  
感谢分享,有助于工资和学习!!!
头像被屏蔽
新手899116 发表于 2022-10-10 15:21
  
提示: 作者被禁止或删除 内容自动屏蔽
奔走的公牛 发表于 2022-10-10 09:23
  
感谢分享,有助于工资和学习!!!
网泰王晓庆 发表于 2022-10-8 14:57
  
楼主分析的很详细,不错的实战经验,小白用户一看就懂,非常好的技术干货帖,顶一个!
发表新帖
热门标签
全部标签>
技术盲盒
西北区每日一问
安全效果
每日一问
干货满满
新版本体验
技术笔记
【 社区to talk】
功能体验
技术咨询
产品连连看
标准化排查
2023技术争霸赛专题
GIF动图学习
信服课堂视频
每周精选
自助服务平台操作指引
通用技术
秒懂零信任
技术晨报
技术圆桌
安装部署配置
答题自测
原创分享
场景专题
升级&主动服务
社区新周刊
POC测试案例
畅聊IT
专家问答
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
排障笔记本
产品预警公告
玩转零信任
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
2024年技术争霸赛
北京区每日一练
故障笔记
排障那些事
高手请过招
高频问题集锦
全能先锋系列
云化安全能力

本版版主

468
227
32

发帖

粉丝

关注

7
11
24

发帖

粉丝

关注

5
7
7

发帖

粉丝

关注

31
34
45

发帖

粉丝

关注

本版达人

新手89785...

本周建议达人

YangZhe...

本周分享达人

runner

本周提问达人