1. 开始响应问题,联系客户/内部同事/渠道,确认并记录故障现象; 2. 接收到需要进行分析和处理的故障单后,联系客户根据故障收集必要的数据信息: (1) 确认故障现象和客户环境 (2) 识别涉及到的客户产品 (3) 收集日志信息,黑匣子,抓包获取信息 (4) 评估后续计划耗时,与客户对齐处理预期
3. 问题定位:工程师根据客户的故障信息与收集的数据信息进行故障分析; (1) 对故障现象做初步的原因分析(软件故障、硬件故障、未定位故障、非我司问题等) (2) 判断产生故障的模块或设备;
4. 确认是否找到解决方案,寻求解决方案的途径: (1) 基于经验处理问题 (2) 通过知识库或机器人直接找到解决方案 (3) 通过内部交流找到解决方案
5. 对无解决思路和方案的问题进行上升技术服务专家处理及同步组长 升级前需补充以下信息: 环境描述(网络拓扑、部署模式、主机数量、用了什么存储、有没有聚合网口等),具体现象(建议有拍照或截图),影响范围(有没有影响业务,及影响情况,是否恢复等等),注意事项,当前已做排查及结果。
6. 将收到的解决方案,与客户进行沟通对齐,确保客户对方案充分理解并认可。
7. 实施解决方案。
8. 实施后,和客户/内部同事/渠道确认问题是否解决确认: (1) 如问题解决,在ICare/PRM录入工单,推送评价链接给客户/内部同事/渠道对本次服务进行满意度评分; (2) 如问题未解决,再次升级,问题回到方案提供人手上继续排查处理。 |