IP城域网环路故障的处理浅析

发布时间:2019-06-19 11:03

冯利芳

(中国联通忻州分公司 034000)

 

作者简介

冯利芳:  北京邮电大学 学士 现工作于中国联通忻州分公司 设备维护中心
联系方式:忻州市七一路37号中国联通忻州市分公司 
邮政编码:034000
联系电话:18603503883

E-mail:fenglf1@chinaunicom.cn

摘 要

本文主要是通过典型的IP城域网出现环路后所出现的故障分析处理,列举案例,通过故障现象、故障处理、原因分析、经验总结几方面介绍,具体剖析组网结构、业务配置等,总结IP城域网中如何规避、减少环路产生,缩小影响范围,减少对业务的影响。

关键词: 

城域网  环路  交换机  OLT 

 

 

一、概述

IP城域网网络BAS以下基本是利用交换机做二层透传,用户通过OLT、小区用户PPPoE拨号的接入实现宽带、IPTV及语音业务,由于网络环路问题,导致网络中的其他用户上网速度变慢甚至不能上网,近期发生几起由于网络环路导致了互联网业务受到影响的故障,通过故障的具体剖析,规避网络环路,保障互联网业务的正常使用。

二、具体故障分析及处理

(一)、由于交换机多上行引发的MAC地址飘移影响业务

故障现象:iptv业务部分错误1302,无法正常使用IPTV业务,经联系维护人员摸排故障情况,仅为IPTV业务IPOE类型,故障范围较广,各城区及乡镇区域均有反映。

故障处理:根据反映故障情况,从城域网BAS侧向下逐层检查设备告警,经查汇聚交换机S8912有环路告警:

#show logging alarm

An alarm 22789 level 6 occurred at 11:50:34 01/26/2017 UTC sent by MEC 1 %MAC%   MOVE from xgei_7/1 to gei_5/18, maybe interface has loop

告警其中VLAN 为4060,正是IPTV业务IPOE类型使用内层VLAN,初步判定可能为此影响。

继续下查其接入端口。告警所显示端口为40G设备,经检查T40G设备为双上行,分别上行S8912及S8912E两台汇聚交换机,并且上行两端口均已配置透传VLAN 4060,均可学习至上行交换机的MAC 地址。

从上行交换机两端口均可学习到4060 MAC,将1个端口的4060 VLAN删除,检查汇聚交换机S8912有环路告警不再出现,同时反映IPTV业务已恢复,可以正常收看。

分析原因:40G双上行组播业务流从两方向进行拉流,应不影响业务使用,故障前业务运行一直正常。分析此业务配置不规范,可能某一用户原因或其它触发环路产生,影响业务使用。

经验教训:现IP城域网内接入层网络设备接入较多,接入交换机上行汇聚交换机中继方式多样:

1、上行至同一汇聚交换机,多条中继负载均衡端口聚合或链路捆绑。

2、上行至同一汇聚交换机,宽带、IPTV带宽分别不同中继。

3、上行至不同汇聚交换机,宽带、IPTV带宽分别不同中继。

本次故障,40G属第3种情况,业务配置时要保证其业务单方向业务流,避免多中继多方向配置引发环路,影响业务。

(二)、接入设备ONU用户端口故障引发的环路

故障现象:OLT C220-2下部分宽带无法上网故障,经现场维护人员核实,故障用户业务均为VLAN 640外层业务,其它业务可正常使用。

故障处理:从其接入上层交换机检查,学不到交换机上行MAC地址,可以学习去OLT层MAC,初判断故障点可能BAS上行故障,经核对BAS与交换机端口对应关系没有问题,且该条中继有其它业务流正常使用,查Bas侧该上线业务有少量几个,与交换机上学习至MAC数据相差甚大,检查交换机告警无环路告警,再次根据反映故障业务情况,故障定位于OTL侧,检查OLT下是否异常,检查环路具体使用如下命令: 

中兴OLT环路检测默认并不开启,如果怀疑有环路,打开环路检测,并配置show logging alarm查看。

打开方法:

1) 、c300(config)#security mac-anti-spoofing enable 

2)、c300(config)#security mac-spoofing-trap enable 

显示方法:

c300#show security mac-spoofing-log 

经检查OLT下1台ONU下显示有环路,进入ONU将产生环路端口关闭后,业务反映恢复。

再次进行接入上层交换机检查MAC地址学习情况,可以学习去OLT层及BAS侧上行的MAC址址。

分析原因:故障发生时从OLT接入的上层交换机学不到上行BAS侧的MAC ,误以为是BAS侧数据配置问题。OLT内部产生环路,其业务VLAN 460本OLT内环路,影响本业务内同VLAN用户使用,不影响同OLT内其它VLAN的业务使用。接入业务端口故障产生环路,将端口关闭后,不再影响本业务VLAN内业务使用,

若及时发现存在环路,将问题端口关闭,在不能及时发现环路时也可采取业务临时替换方法,临时恢复业务,由于宽带故障处理时限、号线资源及端口绑定等事宜,仅作为故障处理一种辅助手段,轻易不进行更换业务VLAN。

经验教训:此类故障一般较为具体在某台OLT或其某个业务VLAN下,影响范围较为集中,基本排除上层设备问题,重点检查OLT侧问题,缩短故障处理时限 。

三、总结

IP城域网的网络结构(如图),网络结构为树型结构,用户VLAN的ID值 都透传至BAS系统,由BAS实现PPPOE的终结,BAS系统通过识别用户的VLAN ID值来区分用户。

在多层交换机级联网络中,任何一个环节产生环路均会造成网络广播风暴,网络中的广播报,进入环路后便不断地循环转发、广播,无法结束,大量的数据包能让交换机的CPU超负荷工作,影响业务使用,严重造成交换机的瘫痪。在现有网络的组网情况下,可以从以下几方面尽量规避、减少环路产生,缩小影响范围,减少对业务的影响。

1、 接入层交换机采双上行链路,做负载均衡端口聚合或链路捆绑时,一定要保证负载均衡,且做好各业务流向规划,避免交叉。

2、 业务接入扁平化,在资源到位的情况话,OLT直接接入BAS,减少交换机级联层次,避免有环路时,业务影响范围扩大。

3、 做好宽带、IPTV、语音、互通及设备管理等业务规划,现已经对不同业务进行VLAN划分,重点是做好各业务流优化,来减少网络环路对用户的影响。

 

 

 

参考文献

1、雷维礼  《局域网与城域网》  人民邮电出版社

2、王文鼐、唐宝民 《局域网与城域网技术》 清华大学出版社

 

 

 

【返回顶部】 【关闭窗口】 【打印本页】