1. OSI七层模型介绍 2. OSI的基本概念 OSI意为开放式系统互联,是Open System Interconnect的缩写,其七层参考模型的各个层次的划分遵循下列原则: 1、同一层中的各网络节点具有相同的层次结构,具有一样的功能。 2、同一节点内相邻层之间可以通过接口进行通信。 3、七层结构中的每一层利用下一层提供的服务,并且向其上层提供服务。 4、不同节点的同等层按照协议实现对等层之间的通信。 3. 排错故障的流程 使用OSI模型的排障的基本方法有三种,自上而下,自下而上,分而治之,这三种方法是沿着OSI模型层次的顺序来定义的,根据故障是属于哪一层的故障来找到解决问题的方法。自上而下的是从应用层到物理层,自下而上是从物理层到应用层,分而治之是从中间开始,至于从哪层则需要根据个人经验。 4. 网络故障分层诊断技术 4.1 物理层及其诊断 物理层是计算机网络OSI模型中最低的一层,建立在通信媒体的基础上,实现系统和通信媒体的物理接口,为数据链路实体之间进行透明传输,为建立、保持和拆除计算机和网络之间的物理连接提供服务。 物理层的故障主要表现在设备的物理连接方式是否恰当;连接电缆是否正确,电缆类型是否正确;设备电源是否未打开,未接通等,确定路由器端口物理连接是否完好。最佳方法是使用相关配置命令,例如show interface、 show ip interface brief,查看当前状态下所有接口的ip简单配置信息,了解端口状态、协议建立状态等等。 4.2 数据链路层及其诊断 数据链路层的主要任务是使网络层无须了解物理层的特征而获得可靠的传输。数据链路层为通过链路层的数据进行打包和解包、差错检测和一定的校正能力,并协调共享介质。在数据链路层交换数据之前,协议关注的是形成帧和同步设备。 查找和排除数据链路层的故障,需要查看路由器的配置,检查连接端口的共享同一数据链路层的封装情况。每对接口要和与其通信的其他设备有相同的封装。通过查看路由器的配置检查其封装,或者使用show命令查看相应接口的封装情况。 4.3 网络层及其诊断 网络层提供建立、保持和释放网络层连接的手段,包括路由选择、流量控制、传输确认、中断、差错及故障恢复等。 排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。例如show ip route,如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障,包括OSPF、RIP、ERGRP等路由协议出现的故障。网络层中常用的排除故障命令包括ipconfig命令,ping命令,tracert命令。 4.4 传输层以上及其诊断 传输层是整个网络体系结构中的关键层次之一,主要负责向两个主机进程之间的通信提供服务,具有复用和分用功能。在终端用户之间提供透明的数据传输,向上层提供可靠的数据传输服务。 排除传输层以上的思路主要是查看防火墙的设置,应用程序的TCP或UDP的端口是否打开,应用程序软件是否设置正确等。 5. 客户案例分析 5.1 问题描述 2019年6月21日晚上左右大连某食品公司说网络及应用访问缓慢,内网用户ping DMZ区服务器时会产生大量丢包,甚至无法正常提供服务,而且会不定时的网络访问慢,严重的影响了正常的工作。2019年6月22日出现了全网瘫痪的问题。客户经过一段时间的排查,并没有发现网络及应用产生故障的原因。2019年6月23日进入现场进行排查。 5.2 网络拓扑图
5.3 排查过程 1、终端PC配置IP地址:58.248.5.108/24,测试外网是否正常。
2、确定某公司的下一代防火墙设备是否损坏,通过管理口登录,在系统设置里ping外网地址,发现无法正常ping通,初步怀疑是AF设备出了故障。 3、客户终端 ping 192.168.1.1正常,ping 交换机上联口192.168.3.1的无法响应,所以能确定是交换机-AC-AF这一段出现了问题。 4、通过console线连接交换机上进行查看,输入命令show run config,查看交换机的配置,show interface 查看接口状态,发现交换机上的网线位置出现偏差,重新还原。
5、测试客户终端PC ping 192.168.1.1 正常,但是ping 交换机上联口192.168.3.1仍无法响应,通过交换机查看命令show interfaces counters rate ,发现有接口流量数特别庞大,怀疑是出现环路现象。将华为交换机的接口一个个拔掉,终端PC 长ping 交换机上连口地址192.168.3.1,在拔掉其中一个接口后,ping 上联口地址192.168.3.1正常。 5、Ping 交换机上联口地址192.168.3.1后正常,ping AC地址192.168.3.2通,ping AF 的lan 口地址192.168.3.3不通。由于192.168.3.2与192.168.3.3地址为同网段,若出现这种问题,有可能是AF的接口出现问题,网线出现故障等。仔细查看AF的接口配置,对比网线插得顺序,发现AF的接口接反了。 6、Ping AC 地址192.168.3.2正常,ping AF的lan口地址192.168.3.3正常,但是过了一会又出现ping AF lan 口192.168.3.3不通,在AF上ping外网地址正常,故怀疑是AC的相关策略配置出现问题,将AC开直通,测试联通性正常,在AC在线用户管理查看,都是外网地址用户,排查出AC的网线也接反了。
7、测试业务正常,全网网络正常通信。 5.4 总结分析 通过对内网的整体流量分析,发现大量未知流量,占用总带宽的99%,导致其他网络访问缓慢。经过交换机查看分析发现由于网络环路导致。由于客户不懂相关的概念,随意插拔网线,促使AC,AF,交换机的接口全部接错。 5.5 结语 网络发生故障是不可避免的。遇到这种问题,需了解客户网络的结构设计,包括网络拓朴、设备连接、系统参数设置及软件使用等;了解网络正常运行状况、注意收集网络正常运行时的各种状态和报告输出参数;熟悉常用的诊断工具,准确的描述故障现象。以上排查思路仅供参考,具体情况需要具体分析!最后祝福大家生活愉快,笑口常开!
注:以上部分相关专业术语参考了CSDN部分博客内容。 |