本帖最后由 秦宇翔 于 2023-9-19 11:39 编辑
某客户反馈安全态势感知平台系统设置中设备运行检测我们安全态势感知(SIP)中纳管华为交换机CPU使用率为百分之百,内存使用率无法显示等问题并且设备显示异常状态(如下图所示)。要求我们使用snmpv3对接,并显示CPU使用率及内存使用率。该图所示为我们SIP自动使用Get形式获取OID值。
在取得华为权限获取Mib库后,我们查找到相应的Oid值,填写后,设备显示离线,SNMP为不扫描状态。删除再重新纳管后,设备在一定时间内显示为正常,但是还是不显示内存使用率及CPU使用率的值,经过一段时间后又显示离线状态。随后和华为工程师进行多方测试后确认,我们安全态势感知(SIP)获取oid值得方式为SNMP-GET,但是华为交换机的方式为SNMP-WALK。我们SIP无法自动获取叶子节点的值,也就是引索值。那问题就很好判断了。
我们在确认获取Oid值得方式不一样后,我们进入后台,对华为交换机的叶子节点值进行获取,获取到了oid后的索引值。(SNMPv2-SMI::enterprises.2011.5.25.31.1.1.1.1.5.16842753= INTEGER: 16,其中16842753为oid的索引值。)将1.3.6.1.4.1.2011.5.25.31.1.1.1.1.5. 16842753填写到oid值后,我们解决了该问题
在问题发现之前,我们试过很多方法,上述的方法是最优解,不知道为什么我们纳管华为设备的过程中,华为交换机后台一直报错提示是认证和加密方式有问题,导致我们走了很多弯路。当我们使用snmpv3的过程中,华为后台报错信息为加密或认证方式有问题,于是我们新建组,改为snmpv1/snmpv2进行对接(因为snmpv1/snmpv2只需要输入团体名),但是仍然不正确,报错信息提示为团体名不正确,随后我们又去想办法测试,snmp不认证不加密,和snmp认证不加密等(上述测试均未填写oid值)。测试结果如下:
如果snmpv1/snmpv2,仅仅显示上下行流量,如果是snmpv3不认证不加密,什么都不显示随后离线,如果是snmp认证不加密,什么都不显示随后离线。我们没考虑过OID值的问题,因为华为二线在对接过程中就说是我们平台的问题,说华为OID值是固定的,所有都是这个值。最后也是我们和二线工程师叶佳判断出问题出现在叶子节点的值这个问题的,很感谢二线工程师叶佳对这个故障事件给予的协助和支持。
后台命令:
此问题所涉及的一些理论知识
1.SNMPGET理论概述:是监控系统主动到设备上查询信息
2.SNMPWALK理论概述:是一个通过SNMP GET-NEXT类型PDU,实现对目标AGENT的某指定MIB分支信息进行完整提取输出的命令工作。
3.SNMPGET和SNMPWALK之间的区别:(1)snmpwalk是对OID值的遍历(比如某个OID值下面有N个节点,则依次遍历出这N个节点的值。如果对某个叶子节点的OID值做walk,则取得到数据就不正确了,因为它会认为该节点是某些节点的父节点,而对其进行遍历,而实际上该节点已经没有子节点了,那么它会取出与该叶子节点平级的下一个叶子节点的值,而不是当前请求的节子节点的值。)(2) snmpget是取具体的OID的值。(适用于OID值是一个叶子节点的情况)
4. 网络管理协议(SNMP)理论概述:主要涉及同信息通信相关的关系和消息流,定义了管理系统上运行的管理站软件如何与管理代理通信,包括两者之间交换的消息分组的格式、含义及名字与值的表示等,此外也定义了被管设备间的管理关系,即提供了管理系统的授权管理。
5.管理信息库(Mib库)理论概述:是TCP/IP网络管理协议标准框架的内容之一,MIB定义了受管设备必须保存的数据项、允许对每个数据项进行的操作及其含义,即管理系统可访问的受管设备的控制和状态信息等数据变量都保存在MIB中。MIB定义的通用化格式支持对每一个新的被管理设备定义其特定的MIB组,因此厂家可以采用标准的方法定义其专用的管理对象,从而可以管理许多新协议和设备,可扩展性很好。
|