本帖最后由 山东_朱文鑫 于 2022-10-8 22:16 编辑
大家好,我是大白,正所谓博观而约取,厚积而薄发。优质的帖子也在尽力中提供,也希望各位道友多多支持,让我引劫渡劫成功哈哈哈。
大白队口号就是:砸锅卖铁我最行,拼死拼活就要赢!!!!!!!!!!!!
今天技术分享的是深信服桌面云智能运维平台IOM原理以及新老版本差异对比和升级指导分享,之前我们已经发了IOM平台的部署信息以及部署方式,对于深信服桌面云智能运维平台IOM的出现,弥补了桌面云虚拟机集中运维的监控的空白,其炫酷的UI也引来较多童鞋额的兴趣,那么今天再讲一下深信服桌面云智能运维平台IOM的原理。
IOM深信服桌面云运维平台:
因为IOM从1.0.0升级1.1.0以后叫做IOMPlus,以下我们就以IOMPlus进行说明。
IOMPlus是什么?
深信服IOMPlus-VDI智能运维平台,提供业界领先的VDI性能诊断方案,可以侦测并 发现50%以上的VDI卡慢问题,并按需提供优化解决方案。该系统结合智能算法等前 沿技术,囊括了应用、网络、存储、虚拟机、物理机等体系的运维解决方案,实现VDI 性能问题的快速排查,7*24小时不间断智能分析桌面云卡慢情况,提供全方位的优化 解决方案。
深信服IOMPlus-VDI智能运维平台本质上是一个针对VDI云服务全景立体化的智能监 控-智能告警-智能分析-智能优化建议的全生命周期运维管理平台。核心思想是:发现 问题、定位问题、分析问题、解决问题。
IOMPlus有什么作用体现?
1. IOMPlus强大的采集能力能够实现VDI全栈跨应用、虚拟机、物理机等层级的监控;
2. IOMPlus结合业界领先的VDI性能诊断经验,可以自动监测并发现VDI卡慢问题;
3. IOMPlus结合自研智能分析算法和产品配置,可以自动针对监测到的VDI卡慢问 题输出问题解决建议和优化配置建议;
4. IOMPlus结合自研智能分析算法和专家领域经验,可以针对VDI的资源配置问题 提供建议,实现降本增效。
IOM的使用场景是什么?
1. 被动排障场景:用户反馈卡慢问题后,客户IT管理员、技术工程师使用IOMPlus 对客户卡慢问题做初步排查;
2. 主动巡检场景:客户IT管理员、技术工程师定期使用IOMPlus平台对桌面云平台 进行检查,查看是否存在卡慢问题,发现卡慢问题时可以及时进行处理,无需等 到用户投诉后再处理;
3. 技术支持排查场景:用户反馈卡慢后,客户IT管理员,技服工程师使用IOMPlus 的智能分析对客户卡慢问题做初步排查后,依旧无法解决卡慢问题,需要研发专 家接入排查。
IOM原理说明:
IOM系统由IOM服务分析平台(运行在虚拟机或物理机上)、IOM展示控制台(WebUI)、 windows虚拟机Pagent采集器、VMP主机Pagent采集器组成。通过Pagent详细采集 虚拟机中的相关信息,并结合IOM自身的智能分析算法,监控和分析虚拟机、平台的 相关问题,并给出对应的解决和优化建议。
总结一句话就是帮你去分析去解决问题,为你解决问题提供建设性建议。
IOM搭建需要准备的信息:
1.VMP平台从5.4.10R1版本开始,VMP支持直接对接IOM平台,同时VMP上运行的虚拟机可自动对接IOM平台。VMP版本必须为5.4.10R1及以上。
2.Centos7物理机&虚拟机承载IOM平台,在centos中进行IOM的安装,作为IOM的管理平台。目前只支持在Centos上部署。如在其他linux其他发行版部署出现稳定性问题均不负责处理。为避免IOM额外占用VMP的资源,建议使用物理机部署IOM平台。建议Centos7及以上版本进行安装
3.IOMPlus安装包IOM组件的安装包,在centos虚拟机内可以通过安装脚本进行一键安装。
4.PagentPagent是信息采集器,需要安装在用户的虚拟机内,以及VMP系统内,从而对虚拟机进行监控。从5.4.10R1版本开始已经集成在agent内部,且该版本VMP已经自带pagent,无需安装。
5.Shell工具IOM安装过程中需要将安装包上传到centos虚拟机内,并进行相关的安装,需要使用shell工具。如pshell、xshell、mobaxterm等等
需放通 IOM 与 VMP、虚拟机之间网络的 9563 和 8023 端口。
1. 受IOM监控的虚拟机:虚拟机通过Pagent将采集数据上传至IOM平台(IOM端监 听9563端口);
2. 受IOM监控的VMP平台:VMP通过Pagent将采集数据上传至IOM平台(IOM端监 听9563端口);
3. 管理员的PC:管理员使用PC通过网络访问IOM的控制台(IOM监听443端口);
4. 所有监控对象Pagent升级:虚拟机和VMP的pagent升级通过网络连接IOM服务器 进行(IOM端监听8023口)。
网络要求:
安装了Pagent的虚拟机(即受监控的虚拟机)要实时向IOM上报流量信息,每台虚拟 机的实时流量为0.0256Mb/s。
如:假设一台服务器上运行50台虚拟机,则此台服务器的物理网口所需带宽为1.28Mb, 若是1000Mb的物理网口,相对来说带宽占用较少;对于IOM平台来说,若同时监控 1000台虚拟机,则IOM服务器所需业务带宽为25.6Mb,若是1000Mb的物理网口,相对来说带宽占用较少。
IOM针对对接的虚拟机数量的不同配置要求也不一样:
说明:
1. IOM平台所需磁盘容量中有50G是IOM系统安装所需容量,余下空间为数据容量要求;
1. IOM数据只保留最近的15天;
2. 要保持较好体验,内存建议16GB起步,如果资源允许,建议多分一些内存和磁盘空间;
3. IOM目前支持接入机器数量上限为10000台,但基于稳定性与数据展示美观性等 情况,仍然建议在大规模接入场景分两台IOM进行业务承载。
4. 如使用独立物理服务器进行部署,建议使用全闪,以获得更好的运维体验。
5. IOM每天收集的数据量如下(以单台受监控的虚拟机为例): 数据条数为 40 万(进程 18 万); 占用 IOM 服务器磁盘空间为 25MB; 每台受监控虚拟机的实时网络流量为 0.0256Mb/s。
存储影响:
于IOM平台需要收集和写入大量的数据,所以对于IOM所使用的存储资源性能有所影响,仅考虑SSD(机械盘的影响可忽略不计),详细情况如下: 【为避免IOM平台额外占用VMP平台的相关存储性能,推荐使用额外的物理机单独部 署IOM,若需要使用虚拟机部署IOM,则请详细查看下列信息进行评估】
1. VS虚拟存储影响:评估是最坏情况在原VS IO读写量不变的情况下,额外增加 IOM的日志写入量,且只影响IOM部署的单台VMP主机上的VS-SSD缓存盘):
500 台虚拟机 IO 写入量 25M*500=12.5G/天,对 SSD 寿命影响约 0.5%
1000 台虚拟机 IO 写入量 25M*1000=25G/天,对 SSD 寿命影响约 1%
2000 台虚拟机 IO 写入量 25M*2000=50G/天,对 SSD 寿命影响约 2%
3000 台虚拟机 IO 写入量 25M*3000=75G/天,对 SSD 寿命影响约 4%
*运行 IOMplus 服务器的 VMP,其上面的虚拟机会比其他的 VMP 主机少很多,所以虚拟机本身的写磁盘 IO 会少很多,真实压力会比上述评估的好很多(上述影响评估是最悲观, 保险起见可以迁移 IOM 服务器运行位置,减少对单台 VMP 上的 SSD 寿命影响)
2. 本地存储影响:(机械盘影响不计,仅考虑SSD)SSD存储空间越大,IOM虚拟 机数据写入影响越小,正常分配存储空间足够用5年左右。
新老升级指导:
老版本1.0.0升级之前无必要要求,需要协调好升级窗口时间,升级前建议备份好原IOM的虚拟机进行快照,整个升级 时间为大约为30min,升级pagent大约5s-30s升级一个为避免广播风暴会进行错峰升级。
升级方式:
1. 登录到智能运维平台IOM1.0,在界面确定版本为1.0,输入账号密码,进入主界面:
2. 在主界面点击[系统设置/系统升级],进入升级界面,点击[立即升级]。
3. 点击上传升级包,将升级包上传开始进行升级。
4. 升级完成后,IOM将自动重启所有服务。等待10-15分钟,手动刷新浏览器,待 重启后并正常到达主界面,在主界面确认版本是否已经正常升级到IOM1.1。
新老版本对比:
UI界面:
自带平台介绍,帮助使用人员更加了解IOM的各种能力。
新功能:
通过AI算法结合专家经验分析过去7天的虚拟机运行数据,自动识别出闲置的虚拟机,并智能估算出其资源占用及优化后资源节省具体值。回收这些闲置的虚拟机,有利于保障集群内资源稳定,避免不必要的开销。
待优化软件识别:
管理员可以通过IOMplus方便快速的找出集群环境、虚拟机环境发生的变化,能快速定位因虚拟机配置变化、业务软件变化和新增流氓进程导致的卡慢问题。并且可以根据用户实际场景对软件列表进行添加或删除。
可新增虚拟机:
能方便了解集群环境虚拟机负载分布,预估服务器硬件资源合理扩容详情,还能灵活自主的指定虚拟机配置和台数来预估。保障虚拟机配置规划合理,集群资源利用率高,用户体验良好。
关注首页及智能分析中待迁移虚拟机算法输出结果,定期主动运维批量处理待迁移虚拟机,保障集群环境资源平稳,主动解决部分主机超载导致的卡慢问题。
通过AI智能算法结合专家经验规则分析统计过去7天的历史数据,推荐出可以减配的虚拟机列表,并智能估算出其资源占用及优化后资源节省具体值。合理配置虚拟机资源可以让集群运行更流畅,减少不必要的管理开销,虚拟机资源利用更合理。
通过AI智能算法结合专家经验规则分析统计过去7天的历史数据,推荐出可以减配的虚拟机列表,并智能估算出其资源占用及优化后资源节省具体值。合理配置虚拟机资源可以让集群运行更流畅,减少不必要的管理开销,虚拟机资源利用更合理。
通过AI智能算法结合专家经验规则分析统计过去7天的历史数据,能高效准确的识别出哪些虚拟机配置过低,并给出最佳扩容方案细节,推荐出待扩容的虚拟机列表。根据集群最佳体验容量和主机负载情况,推荐待扩容分布。根据智能扩容建议,能在最低成本线(人力排查成本、资源成本),提升虚拟机体验。
支持对接邮件服务器,支持自定义配置告警等级。(需定制支持)
OpenSDK对接:
功能优化项-支持列表\报告导出
功能优化项-虚拟机用户字段
功能优化项-重要虚拟机标记
功能优化项-处置建议优化
功能优化项-专有名词注释优化
功能优化项-磁盘IO对比优化
以上就是本次的深深信服桌面云智能运维平台IOM原理以及新老版本差异对比和升级指导分享,以上就是IOM平台的信息,建议大家踊跃的试用一下,感谢大佬们的参阅,此贴先到这里后续会带上更加实用的帖子,感谢大家!
励志分享超清壁纸语句~~:
读书无疑者,须教有疑,有疑者,却要无疑,到这里方是长进。——朱熹
好的今天就到这里,老样子,感谢各位大神的参阅,孩子为了挣豆子不容易,孩子家里穷没豆子吃饭了!!! |