一键排障黑科技:云产品自动化排障工具全景指南
  

SANGFOR_45083 83

{{ttag.title}}
本帖最后由 SANGFOR_45083 于 2025-4-1 17:23 编辑

为进一步提高工程师在客户侧进行问题排障的效率、提高操作质量,云产线从最初技术支持手动编写脚本,直至将其逐步融合、转化为自动化工具。本次为大家分享大云产线的排障自动化工具集,全景图如下(截至2024年):


aDesk排障工具集
VDI外设场景:桌面云在医疗、法院、金融等行业客户,经常性遇到需要将打印机、扫描仪、读卡器、Ukey等外设插入到终端,再由终端映射至虚拟机使用的场景,需要保证外设可以正常识别和使用。
场景障碍:外设经常性由于配置问题无法被虚拟机识别,另外被识别后也无法正常使用,如调用时产生报错;不同种类外设较多,每种外设的特性和排查方法都不同,对应的配置解决方式也不一样(比如打印机和嵌入式设备就相当于两套解决思路),综合难度非常高,往往现场遇到后很难进行排查和处置。
自动化工具推荐:VDI外设排障助手,可以将自动化一键识别当前已插入外设的配置问题,并给出推荐处置建议(此工具合入了目前已知的90%外设问题),使用方法可以点击查看操作指引。


VDI 3D设计场景:桌面云3D场景下由于涉及到3D组件,包括3D软件、英伟达&AMD驱动、显卡、授权服务器等,对于使用体验的要求和配置排障难度会更高,需要对整体链路上的3D组件进行排障,从而保证体验。
场景障碍:3D软件的调优配置、windows环境的优化配置(注册表、服务、任务项等)、英伟达&AMD显卡的特殊优化设置等步骤操作繁琐,且过程中相关报错都需要联系英伟达技术支持进行处置,跨业务沟通难度也大,耗时长。
自动化工具推荐:3D金手指工具,可在虚拟机中进行一键运行并对软件和windows环境进行诊断并自动调优,可解决除硬件性能不足之外的全部3D类体验问题,使用方便简洁,使用方法可以点击查看操作指引。


VDI客户端接入场景:桌面云在不使用盒子,使用PC接入的场景下,需要安装VDI客户端,并通过VDI客户端来接入桌面,需要保证接入和操作过程无异常。
场景障碍:客户端接入时经常由于客户侧的电脑环境原因(如网络、windows环境、VDI组件异常),导致提示报错和无法连接到桌面资源,排查大多数需要查看分析客户端的日志,同时需要工程师对于windows、网络等通用技术掌握较深,难度较大且耗时。
自动化工具推荐:桌面云客户端排障工具,可在客户端一键运行检测,针对检测出的客户端异常项,可以一键进行修复,能解决当前95%以上的端类问题,可以点击查看进行下载。


VDI通用排障场景:桌面云主要体验问题集中在虚拟机内部和平台侧,但排查问题时经常需要进行问题复现,缺乏自动化对虚拟机和平台进行监控和问题识别的能力;同时问题识别后针对虚拟机内部问题,通常是和操作系统自身和资源占用相关,如windows类报错、软件进程占用、内存泄漏、句柄问题等,对工程师的技术能力要求较高,经常需要上网查询相关案例处置方案。
自动化工具推荐:IOM智能运维组件,可部署在HCI和VMP上,并持续对虚拟机和HCI&VMP进行问题监控和记录,并自动给出问题的解决方案,操作上无需工程师和客户进行手动排障,可根据问题分析结果,按推荐方案举措执行即可解决问题,点我查看使用指引。


AD自动化排障工具
AD全量问题排障场景:在AD项目交付过程中,排障环节至关重要。排障效率的高低直接关乎客户业务能否顺畅运行,进而影响客户满意度。因此,快速精准地定位故障,是AD自动化排障工具的核心目标。
场景障碍:故障排查不仅对技术人员的专业能力要求极高,也一直是行业内的棘手难题。在面对复杂问题时,技术人员常常会陷入思路匮乏、难以准确定位故障的困境。而在寻求后端支持时,由于无法提供清晰、准确的故障信息,往往导致排障效率低下。这不仅耗费了大量的人力和时间,更难以有效提升客户满意度,甚至可能对客户业务的正常运行造成长时间的负面影响。
自动化工具推荐:为了解决故障排查中的难题,提高问题定位效率,缩短故障排查时间,让技术人员在面对问题时能够迅速上手分析,AD推出了一款免安装的自动化排障工具——AD黑盒排障工具。该工具能够实现AD设备黑盒的下载、解压与分析全流程一键式操作,自动分析故障并生成详细的排障报告。此外,它还支持对常见典型问题的自动检测,帮助技术人员快速锁定问题根源,从而提升排障效率。可以点击查看进行下载或者从纪元平台下载。


HCI排障工具集
HCI性能诊断场景:在HCI上承载着客户的服务器业务,若服务器和平台性能参数有波动,会导致客户对外的业务访问收到极大影响。
场景障碍:该类场景需要工程师明确掌握产品的性能配置最佳实践,包括主机侧和虚拟机侧,但由于配置项比较繁杂,需记忆较多,容易疏漏。
自动化工具推荐:HCI性能诊断工具(已内置aDeploy和纪元),可以一键检测平台上虚拟机和主机的相关参数配置是否符合最佳实践要求。


HCI硬件排障场景:在HCI的技术支持问题处置中,针对硬件问题的排查占比较高,服务器各类硬件组件(如内存、磁盘、网卡、主板等)出现异常,都会影响HCI上的正常业务。
场景障碍:该类场景均需要对硬件知识和相关命令行掌握全面(也有部分是专属于产品自身的命令)。
自动化工具推荐:HCI硬件排查工具(已内置aDeploy和纪元),将内存、磁盘、网卡等相关排查命令集成到图形化界面,让工程师可以通过图形化操作进行命令排障,降低使用成本并提升效率。


HCI通用问题排障场景:HCI产品的已知报错和相关处置案例较多,且操作复杂,缺乏有效手段进行自动问题识别和推荐方案处置。
场景障碍:该类场景均需要对产品的全量报错、底层命令和技术经验掌握全面,通常只有产品对应模块的研发可以进行相关排障,对于CTI和一线工程师的处理难度极大,基本都需要进行后台操作。
自动化工具推荐:一键排障工具(已内置在aDeploy和纪元),适用于在HCI平台不进入维护模式的前提下,对HCI进行问题诊断,并给出解决方案。


2025年针对云产线(HCI/aDesk/AD/EDS)的自动化排障系列工具也会不断刷新,目前正在面向全体工程师火热进行需求征集,可访问《有奖调研第一期:邀您共创,2025大云自动化排障工具需求征集》期待大家将日常项目中的高频、疑难、耗时长的相关问题处置经验和建议在评论区进行分享说明,产品经理会及时对接和处置。

打赏鼓励作者,期待更多好文!

打赏
暂无人打赏

adds 发表于 2025-3-31 20:06
  
研发工程师辛苦了!!!
发表新帖
热门标签
全部标签>
【 社区to talk】
每日一问
新版本体验
干货满满
功能体验
纪元平台
技术咨询
GIF动图学习
标准化排查
产品连连看
社区帮助指南
自助服务平台操作指引
每周精选
社区新周刊
安全效果
高手请过招
云化安全能力
信服课堂视频
畅聊IT
2023技术争霸赛专题
秒懂零信任
答题自测
专家问答
技术笔记
技术圆桌
在线直播
MVP
网络基础知识
安装部署配置
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
原创分享
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
排障笔记本
产品预警公告
玩转零信任
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
答题榜单公布
通用技术
卧龙计划
华北区拉练
天逸直播
以战代练
技术晨报
技术盲盒
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记
排障那些事
西北区每日一问
升级&主动服务
高频问题集锦
POC测试案例
全能先锋系列
故障案例库

本版版主

52
148
7

发帖

粉丝

关注

本版达人