首页  ·  知识 ·  基础设施
网络故障排除参考
佚名  http://xspace.yyon.cn/html/2/2_itemid_6393.html  数据中心  编辑:dezai  图片来源:网络
1.故障现象:网络性能降低的同时伴有FCS差错 CSMA/CD算法在冲突
1.故障现象:网络性能降低的同时伴有FCS差错
   CSMA/CD算法在冲突发生时会引起校验和无效(即FCS差错),在发生次数不多的情况下属于正常现象,因此FCS差错与冲突同时发生、且发生次数在合理的范围内时就无需担忧。对于本故障现象,可以利用协议分析仪来检测某段时间内冲突发生的次数与FCS差错的次数并分析它们之间的特性曲线,如果在这两者之间找不到对应的关系的话,则可能是如下
    原因一:网络中存在噪声和干扰。
    在网络设备没有接地或接地不正确的时候就会产生噪声干扰,可以用电缆扫描仪或万用表来检测网络中的噪声电平。一个10Base2/10Base5网络中只能有一个接地连线,如果还存在另一个连线接地(如网卡差错或电缆损坏)的话,则由于两个地之间存在压降而引起电缆中的电流泄漏。
    原因二:电缆路由上有电磁干扰。
    复印机、电梯、手机以及寻呼机带来的电磁干扰都可能会引起FCS差错,可以用万用表来检测干扰情况并使用电缆测试仪来检测噪声情况。在检测电磁干扰时,可以检查电缆路由上是否存在电梯、电机、变电器、灯带以及带有高时钟频率或X射线仪器的计算机系统。
    原因三:网卡有故障。
    在检查是否由网卡故障引起FCS差错时,可以检查按网络节点排序的所有无效数据包(大多数协议分析仪都能自动生成这类标准的统计报告),如果发现某个点比较可疑的话,则可以检测该节点的活动率(以数据包/秒为统计单位)与该节点所处网段的FCS差错发生次数。如果发现两者之间存在某种对应关系,那就有机会找到故障源。需要记住的是,由于网卡故障经常是间歇性的出现(如网卡达到一定温度时才出现),因此需要经过较长时间的监测才有可能得到准确和重复出现的故障结果。
    原因四:接头(如NIC、墙插、MAU、中继器、集线器等)松动或损坏。
    定位这类故障源的方法就是仔细检查网络路径上的所有连接情况。 
   
2.故障现象:网络性能降低的同时伴有滞后冲突
    以太网中冲突次数的增加常常与线缆有问题(如线缆段过长)、网卡损坏、级联的中继器数量过多、终端电阻损坏或缺少等原因有关,如果能确定冲突属于滞后冲突还是正常冲突,将有助于我们缩小故障源的范围,滞后冲突的可能原因如下:
    原因一:线缆长度超过了特定网络拓朴所能允许的最大长度。
    此时只需使用线缆测试仪测量一下线缆的长度即可。
    原因二:网络中级联的中继器数量过多。
    可以用网桥代替其中的一个中继器,或者改变网络的配置。
    原因三:网卡或MAU损坏。
    利用协议分析仪收集发送无效数据包最多的站点的运行统计数据,并收集冲突发生次数与活动站点的统计数据以检查两者之间是否存在对应关系,如果这些方法无法找到故障源的话,就必须使用网络分段法来排除网络故障了。
3.故障现象:网络性能降低的同时伴有早期冲突
     原因一:终端电阻损坏或缺失。
     10Base2和10Base5以太网必须带有50Ω的终端电阻,检查网络中所有需要终端电阻的地方是否均安装了正确的终端电阻,其阻抗可以用万用表来测量(阻抗值应介于48Ω~52Ω之间)。
      原因二:T型接头松动或损坏。
      检查网络中的所有接头,以确定是否有松动或损坏现象。
      原因三:网络中的节点数过多。
      检查每个网段中的MAU数量,一个10Baes2网段中最多不能超过30个MAU,而一个10Base5网段中最多也只能数据U讥2/10Base5Mbit/s有100个MAU.
      原因四:线缆被扭折。
      可以使用线缆扫描仪来定位并替换被扭折的线缆。
      原因五:电缆与IEEE 802.3不兼容。
      IEEE 802.3的10Base5电缆每隔2.5米就以一种颜色加以标记,为了减少连接点处的反射干扰,接头的插入点应选择在这些颜色的标记处。此外要记住,并不是所有的BNC接头都使用50Ω的电缆,尽管以太网能在75Ω的电缆上传输几十米之远,但是长度的增加迟早会引发网络故障,因而在检测网络故障时要检查所用电缆的规范。
4.故障现象:网络速度慢、响应时间长(冲突与FCS差错均处于正常范围)
     原因一:传输路径上的网桥或路由器的缓存溢出。
     检查路由器或网桥的统计数据(如CPU使用率、端口使用率等),利用协议分析仪检测哪个站点产生的经由网桥或路由器转发的流量最大?是否有超时现象出现?一般可以用ping命令来测试通过网桥或路由器的响应时间,以查明网络互连设备是否是引起故障的部分原因,如果是的话,就需要重新配置网络(如将部分服务器或客户机移到其他网段)以减轻重载互连设备的流量。
    原因二:光纤链路的传输问题。
    在光纤链路衰耗过大或发射光功率过低的情况下,如果光纤链路的传输距离过长可能会引起性能劣化(即使没有出现任何FCS校验差错)。此时可以用ping命令来检测有问题的光纤链路的响应时间,并检查光纤耦合器及线路衰耗的设置情况。
     原因三:存在本地网段路由。
     本地路由是网络速度减慢的常见原因,常常发生于子网地址不同、但连接在同一个LAN交换机下的两个节点之间的连接上,且LAN交换机连接在一个路由器下,这种本地路由有时也称为one-armed路由。此时,尽管这两个节点均连接在同一个交换机下,但它们之间的数据包必须经过路由器的路由之后才能到达对方。
5.故障现象:间歇性的出现网络连接故障、网络性能降低以及帧对齐差错。
    原因一:网卡在每个FCS之后还发送了一些额外的比特。
    可以使用协议分析仪捕获在FCS之后有额外比特的数据帧(称为dribble数据帧或帧对齐差错的数据帧),从数据帧的源地址中就可以找到有故障的网卡。
    原因二:最大传输距离超出了以太网的规范。
    数据包能否到达最终目的地取决于发送站点和接收站点,在两个站点相距较近时一般没有什么问题,但是在两个站点相距较远、且处在同一个网段中时就有可能会出现连接问题。此时就需要尽力找出这类连接问题是否只与某些特定的节点有关,可以使用线缆测试仪来检测传输路径上的线缆长度和质量,必要时可以在传输路径上插入一个网桥或路由器。
    原因三:如果在传输路径上级联了过多的网桥或路由器,将会导致信号的传输延时增加和协议超时(如TCP超时),可以使用ping命令或响应时间代理来检测响应时间。

6.故障现象:网络连接出现间歇性故障的同时伴有短包。
   原因:网卡有故障。
    可以使用协议分析仪捕获短包并从短包的源地址中找到发送节点,如果源地址字段损坏,则可采用前面讲述的相关测试方法来找到有故障的网卡。
7.故障现象:网络连接出现间歇性故障的同时伴有超时传输包
    原因一:由于在10Base2和10Base5以太网中存在两个接地连接,因而在网线中产生直流电流。可以使用电缆测试仪来检测网线中的直流电流。
   原因二:网卡损坏。
    网卡损坏有时会产生jabber数据帧(即超长数据帧),导致所处网段出现连接故障。可从协议分析仪捕获的jabber数据帧的源地址字段中找到失效网卡的位置。
8.故障现象:网络连接出现间歇性故障的同时伴有帧间距过短现象
    原因:帧间距过短引起数据包丢失。
    如果以太网中的站点不能维持正常的最小帧间距(10Mbit/s以太网中为9.6μs,100Mbit/s以太网中为0.96μs)的话,某些集线器设备就无法正确处理接收到的数据包。此时,数据包有可能会转变为jabber数据包。在进行故障检测时,可以用协议分析仪来测量帧间距(可由数据包的时间戳得到帧间距),之后,再从协议分析仪捕获的数据帧的源地址字段中找到失效网卡的位置。
9.故障现象:经由网桥互连的传输路径上出现间歇性的网络连接故障
     原因:由于网桥使用了负载均衡功能而打乱了数据包的到达次序。检查网桥的在必要时关闭网桥的负载均衡功能。
10.故障现象:经由路由器互连的传输路径上出现间歇性的网络连接故障
     原因:路由器连接在重载WAN链路或所连接的WAN链路质量较差。
     排除这类故障可以使用协议分析仪由器所连接的WAN链路的使用率,FCS差错率以及误码率,此外,分析路由器端口的日志也有助于我们找到故障原因。
11.故障现象:单个节点与网络失去连接
     原因一:MAU与网线或网卡与网络的连接松动或连接失效。
     单个节点突然与网络完全失去连接的主要原因如下:
    l MAU连接松动;
     2 连接电缆断开、短路或有噪声干扰;
     3 网卡失效。
     此时需检查电缆、接头、网卡是否有问题,在必要时应予以替换。为了确定故障是否是节点本身,可以用一个工作正常?
本文作者:佚名 来源:http://xspace.yyon.cn/html/2/2_itemid_6393.html
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的