PON 网络运维手册
文档编号:WASU-IPNOC-YYYYMMDDNN-10
PON 网络运维手册
(Version 1.0)
网络管理部
2009年3月10日
关键词:技术
目录
1. 2. 2.1. 2.2. 2.3. 3. 3.1. 3.2. 3.3. 3.4. 4. 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. 5. 6. 6.1. 6.2. 7. 8. 9. 10.
目的.............................................................................................................................................. 4 描述.............................................................................................................................................. 4 PON 网络定义 ........................................................................................................................ 4 PON 网络组成 ........................................................................................................................ 4 网络管理 . ................................................................................................................................. 6 网络结构及拓扑 . ......................................................................................................................... 6 网络结构设计 . ......................................................................................................................... 6 网络拓朴 . ................................................................................................................................. 6 拓扑结构 . ................................................................................................................................. 6 可靠性 . ..................................................................................................................................... 9 操作规范 . ..................................................................................................................................... 9 资源规划 . ................................................................................................................................. 9 主动维护规范 . ......................................................................................................................... 9 网管监控 . ................................................................................................................................. 9 故障管理 . ............................................................................................................................... 10 问题管理 . ............................................................................................................................... 10 故障处理流程 . ....................................................................................................................... 12 ONU 安装流程 . ..................................................................................................................... 13 备件............................................................................................................................................ 13 资源管理 . ................................................................................................................................... 14 VLAN 资源管理 .................................................................................................................. 14 BRAS 子接口规划 . .................................................................................................................. 14 PON 今后的工作 ...................................................................................................................... 14 日常FAQ .................................................................................................................................. 15 感言............................................................................................................................................ 15 附录............................................................................................................................................ 15
PON 网络运维手册
1. 目的
由于PON 网络的盛行,在我们网络内的大量应用,PON 的运维手册使得新员工和运维人员及时获得相关PON 的情况,包括PON 拓扑、相关业务、常见故障处理、配置规范、运维知识等。同时通过该手册能让运维人员对PON 有实质性了解,并提高运维能力,便于今后的维护和故障处理。
2. 描述
2.1. PON 网络定义
PON 网络主要是接入层和汇聚层网络,介于用户和骨干设备的网络,为远端用户提供接入。
2.2. PON 网络组成
1、 接入设备
ONU -光网络单元,提供远端用户的接入,对用户数据进行缓存,并在OLT 分配的发送窗口中向上行方向发送。ODN 由无源光分路器和光纤构成。 2、 汇聚设备
OLT -光网络终端,控制ONU 状态,并为ONU 分配带宽。汇聚数据流,并向ONU 以广播方式发送以太网数据。 3、 设备组成
4、 业务实现
现PON 网上承载的业务主要分为:
普通拨号用户及数字电视点播业务――主要承载在小区的PON 接入设备,如润新,华为的设备。为远端机房用户提供接入服务。
企业专线及VPN 用户-现所有新增的VPN ,专线用户都需要从华三的7502E 上接入汇聚。
无线站点接入,作为无线AP 的接入。 5、 主要设备分布
专线和VPN 接入的设备每个POP 机房都有分布,一台7502E 可以提供256个用户接入。小区接入:
2.3. 网络管理
PON 网络管理是指对PON 网络的日常维护,配置,优化等工作。
ONU 的维护部门是数字电视网管中心和维护,他们处理不了移交到网管中心。 OLT 的维护部门是网络管理部,内容有日常故障处理,配置备份,设备升级优化,厂家沟通反馈,相关数据的维护。
3. 网络结构及拓扑
3.1. 网络结构设计
由于PON 设备是非CISCO 设备,在网络中非可见的设备,不合理的接入方式会增加排障难度,一般上联是直连骨干的设备,在远端机房是上联到本地汇聚交换机。PON 网的设计一般以简单,独立实用为主要原则,避免不同设备间对数据流的不同操作而影响业务。
3.2. 网络拓朴
现PON 网络结构比较杂乱,润新的设备功能及相关特性比较缺乏,现都接在小区的交换机或华为的65下面;华为的设备一般接在本地机房骨干或汇聚设备下;华三的设备提供的是专线和VPN 接入,在VPN 改造中逐渐会有合理的上联方式,专线链路直连POP 骨干设备,VPN 链路直连VPN 骨干设备。
3.3. 拓扑结构
一般结构:
● 润新拓扑:
上连方式:
● 华为拓扑
● H3C 设备拓扑
● 中兴设备拓扑
3.4. 可靠性
由于是接入汇聚设备,只需链路和设备可靠性要求即可。由于润新设备本身需要2条上联链路,增加了故障点,且本身设备问题比较多,以后新增的交换机都会用其他厂家的设备。现华三和中兴设备都具备双电源双引擎,华三75系列对VPN 有备份链路,充份符合了可靠性要求。
4. 操作规范
PON 的配置规范有《华为EPON 配置手册》,《润新EPON 配置手册》,《中兴EPON 配置手册》,主要针对不同设备,不同业务有固定的配置。
4.1. 资源规划
1、 对于小区接入PON ,每个设备和小区都有固定的VLAN 规划,在配置和检查故障的时候需严格按规划部署,以防环路产生。
2、 对于专线和VPAN 接入,每个onu4个口子都有固定的规划,现规定为1口是VPN 2口是数字电视专线 3口是企业专线 4口备用 3、 PON 的资源新增需要工程部的反馈。
4.2. 主动维护规范
润新PON 设备的配置保存,每月一次,保存地址是:172.25.254.83 。 由于PON 本身设备不成熟,出现许多问题,需要及时和厂家联系,并持续跟踪,相关问题需要及时记录。
4.3. 网管监控
Syslog ,what ’up ,Nms 监控都无法将PON 设备添加,需要厂家的管理软件的支持,需要厂家的管理软件的支持,现还没使用。
流量监控
设备本身的缺陷,润新不能添加到新的监控系统中,华为的已经添加到系统中,但只能显示上连口的信息。华三的设备还没有添加近监控系统。可为链路状况提供参考,若上连链路流量过高,可扩充链路。 监控地址是:http://172.25.254.22/main.jsp
4.4. 故障管理
PON 的主要故障有: 1、 ONU 未注册
2、 ONU 下用户断线,无法拨号 3、 丢包,无法获取IP 4、 OLT 无法登入,DOWN 机
统计了2008和2007年所有PON 的故障,除去线路问题,其中华为设备的故障主要为单点ONU 问题,ONU 损坏;润新的问题比较严重,有多次OLT DOWN机,所有ONU 下线,未注册,经过厂家分析升级版本后还是不能解决,现已让厂家跟进了。环路的问题一直都是困扰PON 网路的主要故障,虽然PON 有防止环路的机制,但本身设备的缺陷,防环都还不够完善,以至于排除环路本身也很复杂,主要原因是1个PON 口下所连接的ONU 数,用户数很大,所需要的工作量就不可小视了。
4.5. 问题管理
润新:
1、ONU 全体掉线
据了解该故障已发生1年半有余,其中去年为此升级版本3此,2009年升级版本一次。虽然简单的重启能暂时解决掉线问题,但是厂家一直没有给出合理的解决方案,为次该故障依然没有解决。并且发生的频率越来越高,已经严重影响了现网的业务。 2、新版本测试
2009年3月,针对ONU 全体掉线问题厂家给出了最新版本1.3/3.8,在升级过程中,有3台设备发生异常,及时回退版本后恢复。导致后续升级计划取消.2009年3月23号,其中升级好的一台设备还是出现掉线问题,现不能确定是不是设备本身硬件引起,还是软件版本问题。后续的软件版本升级需要再确认和安排。 3、备件管理
2009年2月,统计了润新备件,总计2台,经后来确认这两台是向厂家借的。备件的购买还在流程当中。3月份有2次OLT 故障,替换了2台,至此没有备件。当时厂家临时寄了一台当做备件使用,经测试是可以使用的。但返修的备件厂家一直没有寄回。 华为: 1、备件管理
2009年2月份统计华为备件,有机框电源引擎各2块,但是没有业务卡。据反馈说老的65型号的OLT 的业务卡已经不生产了,再扩业务只能用新的H3C 的75E 系列。若业务卡故障,无备件更换。做为解决方案,将江干市政的65上的8口业务卡做为备件,卡上的业务会切到新增的H3C 的75E 上。
注:老的华为65只能支持老的业务卡,H3C 的75E 系列不能支持204ONU 2、港湾家园问题
2009年2月,反馈说港湾家园704-L 的ONU 下数字电视业务正常,拨不上号,上不了网,但重启ONU 后就能暂时解决,故障比较频繁。经查怀疑是704-L 的onu 与65系列OLT 交互存在问题,让厂家解决。厂家支持力度不够,到3月才派人去现场抓包分析,确认为ONU 本身问题。厂家给出了新的版本做测试,这周针对故障比较频繁的ONU 做升级处理。 3、254 ONU问题
采购的一批254ONU ,在老的65上,原有的配置针对现有业务无法实现,为规范配置统一,厂家已经提供了704更换254的ONU ,这个月准备各部门协调更换掉全网的254ONU.
中兴:
1、ONU 上行流量问题
之前无线组针对AP 注册问题去现场打流量,结果显示流量很小。经与厂家确认是由于ONU 本身有个流量限制问题,需要手动修改每个ONU 的上下行流量。 2、江南大道ONU
江南大道一个点的ONU 频繁重启,更换多次后还是如此。已经联系厂家,需要厂家去下场查看。故障原因是本地电压不稳定,5分钟会掉电一次。
4.6. 故障处理流程
应急故障处理请参照《EPON 应急处理手册》。 一般处理流程如下:
4.7. ONU 安装流程
5. 备件
设备的备件管理在日常运维中占着很大的重要性。故障的抢修、设备的维护都需要备的支持,备件的管理好坏关系直接影响到网络的抢修以及运行质量的好坏。PON 的备件管理原则:各类设备至少保留一块备件。 现有备件如下:
根据以往匹配系数0.1,发现备件是不够的,需要重新申请备件数目。
6. 资源管理
6.1. VLAN 资源管理
VLAN 资源有限,必需全网统一规划,便于使用和管理。根据业务类型制定VLAN 规划,这样使VLAN 的利用率提高,同时便于管理。小区接入VLAN 根据不同的地区接入有不同的规划,EPON 接入的VLAN 一般801-830。
VPN VLAN 规划:远端机房接入的用户是1300-1999, 本地机房接入的用户是2000-2999, 二层VPN 用户的为3000以上(以前的2层一般不做更改) 。所以在分配资源,配置查询的时候需严格按照规划执行。
6.2. BRAS 子接口规划
PON 网络主要提供远端用户的接入,用户量相对小区接入较小,一般在BRAS 上配置100个为宜,若出现某地区用户数过多,再另行增加。新的BRAS E320可动态分配子接口,因此不需要规划部署。而对于有些还在使用ERX700的需要关注及规划。今年预计将把所有 ERX700下线。
7. PON 今后的工作
1、 网管系统
华为,H3C ,中兴都有自身的网管系统,在今后会添加这些网管系统,从被动发现故障转变为主动巡检处理故障。 2、 PON 问题跟踪
PON 问题存在比较多,用户范围大,地域广,一旦出现问题影响可能比较大,影响时间也长。所以一旦发现问题,应立即解决。对于暂时解决不了的问题,需要及时跟踪。加强厂家的支持力。 3、 备品备件
PON 设备厂家复杂,一定要保证每个厂家的备品备件,及时返修坏件,保证现网业务不受影响,对于没有备件的,督促厂家给出解决方案,在故障发生之前解决。 4、 规范化
由于PON 设备厂家多元化,针对各种业务配置都不一样,需要严格规范各厂家的配置。
8. 日常FAQ
1、 ONU 未注册
确认ONU 的各种状态灯都正常,在排除ONU 设备故障后,再确认光衰是否大于零界值ONU 端>(-22dB ),OLT 端(-1~+3dB) 2、 环路检测
润新:(config)# loopbackcheck
(config-loopbackcheck)# show all
华为:[HZD3Z-A-PON-6503-01]dis loopback-detection
[HZD3Z-A-PON-6503-01-Onu2/0/1:1]dis onu-protocol stp
如果在设备上查看不出结果,需要手动排查环路。也就是需要一个一个接口关闭测试。
9. 感言
由于PON 的网络具有其独特性,现在很多厂家设备还不够完善,存在的问题比较多,需要大家花更多的时间和精力,辛苦各位同事,这样才能保持我们网络的质量,提高用户的体验。
10. 附录