基于OSS系统的一体化维护分析

发布时间:2019-06-19 09:48

南康珊


(中国联通山西省分公司 030001)

作者简介

南康珊:  山西财经大学 硕士 现工作于中国联通山西省分公司 网络管理中心

联系方式:太原市小店区数码东路5号中国联通山西省分公司

邮政编码:030001

联系电话:15536805502

E-mail:nanks1@chinaunicom.cn

摘 要

本文主要是中国联通XX分公司依托OSS系统对一体化维护工作支撑效果分析,从系统架构,系统功能,系统支撑、效果分析四个方面围绕一线维护工作开展系统开发及优化工作,为资源和激励的穿透落实打基础,最终提高了故障处理的能力,加快了运维集约化的进程,为一体化维护提供动力支撑。

关键词: 

告警 告警关联 自动派发  一体化维护

ABSTRACT

This article mainly is the branch of China unicom XX rely on OSS2. O analysis on effect of integration of maintenance support system from the system architecture of the province, system function, system supporting ,effect analysis,four aspects around a line maintenance system development and optimization work, through to carry out the groundwork for resources and motivation, eventually improve the ability of fault handling, accelerate the process of the operational intensification, maintenance of powered support for integration.

   KEY WORDS:

Alarm ,alarm association, automatic distribution, integrated maintenance

1 概述

随着通信网络的不断扩容,对网络维护质量的重视程度越来越高,在通信网络维护过程中,繁杂而重复的业务逐渐增多,按专业的维护模式显得过于分散,造成处理故障的效率降低,维护质量下降,造成资源浪费和维护成本的增加,集中化的一体化维护模式应运而生。

为适应“互联网+”,实施基于大数据的一体化运营模式改革,实现动力、活力与效率的提升,OSS系统通过扁平化组织的形式,为资源和激励的穿透落实打基础,通过集约化支撑确保一体化改革有效落地,并进一步促进专业化穿透。

中国联通XX分公司基于现有网络针对集约化运维支撑的要求,为提高网络故障处理能力,将现有网络的150多套专业网管集中采集,通过资源与维护人匹配,将故障直接派发至维护人,并结合实际情况制定了相应的优化方案。

2 系统架构

2.1 建立统一采集平台

通过统一支撑平台,运营“三集中”及保障“四包一清单”,实现网运线的纵向专业化穿透,建立网络最小单元。

自2014年6月起,中国联通XX分公司启动OSS系统建设工作,建立统一采集平台,将现有网络的150多套专业网管告警及资源配置信息统一采集,创建四大功能模块,支撑告警与资源关联,实现自动派单并量化工作量,同时可通过集团OSS2.0系统将一干告警回传,实现省分呈现及调度,为“四包一清单”提供有效支撑。

2.2 系统架构

XX省OSS系统包括4大模块1个平台1条总线。四大模块分别是告警、工单、资源、性能模块;1平台为统一采集平台,全省已接入150多套专业网管,均通过统一采集平台采集专业数据。1总线为ESB总线,由专业网管采集到的告警、资源、性能等十几种数据存储在ESB总线,实现了数据共享。系统利用内、外部交互达到了采集、数据、应用分离的目的,减少了重复投资,提升了应用的快速拓展能力。从监控、定位、派单、跟踪、到评估,系统全程实现了电子化的闭环管理。(下图为OSS系统架构)

2.3 系统模块介绍

OSS系统主要分为四大模块:告警模块,资源模块,工单模块和性能模块。

• 告警模块:告警模块是跨专业、跨地市、面向全网的告警集中管理,消除各网元网管以及专业网管系统之间的信息孤岛,实现全网各专业告警在同一平台上的标准化呈现,故障的主动发现、快速定位,故障工单的派发、督办,达到告警全生命周期的统一监控、集中管理。

• 资源模块:资源模块是OSS系统的一个子系统子模块,为OSS的数据提供支撑。资源模块用于支撑OSS系统的告警模块、性能模块、工单模块的业务处理功能,实现告警快速准确定位和处理。

• 工单模块:主要是以资源模块录入的设备与维护人员一对一关系为基础,对告警模块满足派单规则的告警进行工单的自动派发。工单模块支撑了工单一派到底,实现了工单的直接到人,减少了中间转派环节,有效缩短了故障处理时间。

• 性能模块:统一采集平台采集到的设备性能指标可通过性能模块展现,为设备性能分析,业务前景分析提供依据。

3 系统功能特点

OSS系统实现了对全网全专业告警的集中监控,通过资源与设备维护人的对应关系,实现告警的自动派发;通过资源与工单的统计,实现资源包与任务包的量化;通过指标管控,实现负面清单的管控,OSS系统功能主要有智能定位故障功能,告警压缩功能,资源动态管理功能以及工单的闭环管控功能。

3.1 智能定位故障功能

OSS系统采集的告警根据派单规则和资源进行匹配,进行故障的准确定位。派单规则有两部分组成,一部分是系统从海量告警中提取的告警标题,一部分是由各专业共同制定的专业内和专业间的派单规则。派单规则可以根据维护的实际情况进行灵活配置,如告警规则延时为7分钟,是为防止专业网管中的闪断告警对维护人员反复派单,减少维护人员不必要的工作量,提高维护效率。

3.2 告警的压缩功能

传统的网络运营维护模式实施专业式管理,各专业中心仅对自身承担的网络模块负责,网络维护情况复杂,由于各专业维护中心均从各自的网络环节角度考虑,即使考虑同一网络故障,在重视程度、响应速度、故障处理优先等级等方便也存在差异,各专业间很少存在沟通与协调,这大大降低了整体问题的解决效率,形成了网络维护质量再提升的重要瓶颈。专业网管的告警量非常大,OSS系统通过告警关联规则设置,把各专业的告警进行关联、压缩。目前OSS系统内工单告警压缩比控制在万分之五以内,也就是一万个告警最多派发五条工单。

如传输光路中断会导致下带传输网元脱管、引起基站中断、小区退服这个关联规则,传统故障处理方式为人工查找台账、无线与传输专业电话沟通、网管监控手工派单,同时需要和维护人员解释告警详情,现在OSS系统根据告警关联规则只需要给传输维护人员派发一条工单,无线维护人接受抄送工单,这是对告警进行了压缩,大大缩短了故障定位的时长。

3.3 资源的动态管理  

资源模块主要是为OSS系统的数据提供支撑,以往我们的资源管理对人的依赖性较大,完成一次性资源清查容易,后续动态更新困难。为解决这一难题系统采取了两个措施。一是引入了静态资源概念,二是增加了增量核查手段。目前系统资源的来源是由网管自动采集的动态资源和地市手工上报的静态资源相结合。以静态资源为基准,多自动采集,少人工填报,与系统统采集的动态资源进行匹配,可以核查出动静态资源匹配率及未匹配明细,这就是增量核查。通过点击未匹配数,查看未匹配明细,维护人员定期完善未匹配资料,在资源间建立关系,完善资源管理。

 

3.4 工单闭环管控

OSS系统对工单的整个流转过程提供多样化的管控手段,通过建立客观的指标体系把控工单各个环节:

回单环节:为了实现工单的闭环管理,系统制定了回单率,为了保证工单的及时处理,系统制定了超时率。

签收环节:为了监督维护人员接单情况,系统制定了签收率,确保工单第一时间通知至维护人。

销障环节:为了保证工单的完成质量,系统制定了未修先销率。     

工单的各个环节指标都可以通过报表体现到地市、区县、部门、基层责任单元直至维护人员。系统提供可量化、透明、系统自提取的数据依据,更加有效的支撑了运维线故障处理工作的积分落地,为一体化维护工作提供有效的系统支撑。

3.5 集团OSS2.0一干告警回传

针对一干重要设备的集团网管告警,通过集团OSS2.0系统将告警回传至省分ESB,在省分系统录入资源信息,配置符合本地化特色的派单规则进行派单,减少了人工监控的环节,实现了一干告警的自动派发。

4 系统支撑

4.1 客服支撑

OSS系统告警模块的特色功能就是主动服务功能。在群障拦截里,系统能准确定位到宽带设备所影响用户的用户数,用户账号,地址以及维护人员**,在客户投诉时,客服人员输入账号就能查询出故障的详情,并将信息反馈至用户及维护人员,提升了用户的感知,保障了末梢服务工作的落地,有效地为客户服务工作提供支撑。

4.2 报表支撑

为了深度分析网络故障,系统开发了报表功能。有整体报表,超短、超长、超频报表。通过3超报表可以准确快速的提取出超频及超短的告警,及时发现隐患、处理问题。通过对现网告警的分析,有效提高了网络质量和客户感知度。

4.3 运行管理效能明显改善

1)故障直接定位。所有专业告警汇集到一个界面,实现专业间告警关联,快速准确定位故障。

2) 压缩工单数量。OSS系统直接派发故障工单,提高工作效率。

3)全面应用电子工单。电子工单直达一线具体维护人员,全过程管控,责任到人,自动闭环,实现维护作业的穿透式管理。

4)以提升效率为导向,通过推进集中化维护,逐步上收运维工作,强化省公司生产能力,使末梢工作简单化、模式化、指令化;通过流程扁平化的再造,减少管理和生产层级,实现体系运作高效、资源配置高效、人员结构优化的集约化。

 

 

4.4 支撑“四包一清单”

OSS系统通过资源模块录入维护人信息,核对维护人资源包;通过网元告警比核查在网设备的运行情况,测算任务包;通过工单处理时限实现激励包的奖励;通过未修先销工单审核,动静态资源匹配情况实现权利包的应用;通过指标管控,实现负面清单的核算,报表功能支撑至地市、区县、部门、基层责任单元直至维护人员,支撑运维积分工作的落地。

5 效果分析

OSS系统从专业网管精确采集告警,通过告警关联等规则在资源中找出关联信息,定位主告警,减少了需要通知的专业及维护人员,灵活的派发原则可以保证工单及时准确派发,保证维护责任真正到人。通过强化资源管理、告警监控、工单管控的组织架构达到统一监控和集中管理,提高了故障处理的能力,加快了运维集约化的进程。

5.1 明确工作职责,提高工作水准

通过OSS系统企业的的运行和维护模式发生重大变化,维护责任到人,系统透明量化,权责清晰。横向上,同级单位KPI指标排名,纵向上,管理的深度延伸至各维护节点,使各维护单位和人员均能明确各自的职责,将传统的粗放式管理更加精细化,制度化,通过扁平化的管理整合不必要的环节,提高管理效能。

5.2 完善协同机制,调动工作积极性

OSS系统不但要使各单位,部门信息人员明确各自在办单位,部门中所承担的职责,还应统筹全局,关注上下级设备运行状态,实现分工协作,协同配合,转变观念,承担起发现问题,反应需求的桥梁和纽带。通过整合优化,统一调配资源,逐步建立合理分工,有效配合的协同工作机制。

5.3 依托OSS系统,提升运维效率

OSS系统流程规范化,操作标准化,一致化,可降低运维成本,提高运维水平,减少故障流转环节,准确定位问题;一体化的资源维护,故障处理流程为维护人员制定统一的规范和约束;集成,开放可扩展的系统开发平台推动运维工作智能化和高效率。

OSS系统从网络故障处理,资源动态管理,提高维护效率,降低维护成本等方面起到了优化作用,提高了通信网络的维护质量,实现了末端用户感知的持续提升,支撑了运维“四包一清单”的有效落地,为一体化维护提供有力支撑。

参考文献:

1、蔡银平 《通信运营商网络维护的一体化策略研究》中国知网

2、刘建平 杨龙江 《IT运维管理一体化模式浅析》   万方数据

【返回顶部】 【关闭窗口】 【打印本页】