艾默生ups电源官网指定服务商 >> 电源资讯
维谛通信电源基站动环监控系统组网方式
作者:admin 发表时间:2018-6-13 8:26:10 阅读:

  1引言

 维谛技术通信电源的动环监控系统共接入站点约3000余个,建设时间可追溯到十年以前,动环监控系统现有的传输网络十分复杂,一旦发生故障,严重时会引起成百上千的基站、传输节点、核心机房监控中断,因此必须重视动环监控的传输架构的健壮性和可维护性。

  2动环传输网现状

  2.1基站动环传输网架构

  

   基站动环传输网架构

 维谛技术基站动环监控传输网络架构由底端上行主要分为接入层、汇聚层和核心层三个层次,通过SDH以及PTN两种传输网络方式进行承载。

  2.1.1 SDH传输方式:

  1)接入层层面:基站机房内的FSU(动环现场监控单元,以下统称FSU)通过SDH传输网络分配的E1传输线路汇聚到节点机房;

  2)汇聚层层面:节点机房通过RC951协议转换器将接入层上行来的多路E1线路汇聚并转换为1路以太网线路,再通过RC952协议转换器将1路以太网线路转换为1路E1线路,实现将接入层上行的多路E1线路数据汇聚为1路E1线路数据,并通过SDH传输网络上行至核心层机房;

  3)核心层层面:核心机房通过RC951协议转换器将汇聚层上行来的多路E1线路汇聚并转换为1路以太网线路并接入核心机房动环监控三层交换机,最终通过交换机上行至LSC(区域监控中心/市动环监控服务器,以下统称LSC)。

  2.1.2 PTN传输方式

  1)接入层层面:基站机房内的FSU通过尾纤直连机房内的PTN接入层传输设备;

  2)汇聚层层面:PTN传输汇聚环网络;

  3)核心层层面:核心机房PTN汇聚层传输设备尾纤直连核心机房内动环监控三层交换机,交换机针对每个上连的基站FSU地址分配相应VLAN,最终通过交换机上行至LSC。

  2.2动环传输网目前存在的问题

  2.2.1故障处理过程

  (1)故障现象:

  2018年6月12日下午17点,维谛技术有限公司动环监控系统出现基站FSU批量闪断告警,半个小时大概100个站出现中断告警,区域分布较广,经查询这些中断基站均承载在SDH传输网络,IP地址集中在172.18及172.19地址段。

  (2)排查过程:

  1)首先根据故障现象判断核心层172.19段三层交换机有问题,现场重启了交换机、更换此交换机上连到172.18段三层交换机的网线并更换了上联网口发现闪断频率有所下降但仍未恢复,且在约1小时后闪断频率再次破百。

  

  表1 基站闪断分析表1

  随即判断是172.19段的交换机有故障,更换了172.19段交换机并重新配置了相关的路由及网关信息,但闪断现象仍存在。

  2)通过查看发现172.19段的交换机CPU使用率过高达95%左右,尝试关闭了所接的RC951上连端口,发现CPU使用率有所下降,但闪断现象仍然存在。

  

  图2 交换机CPU使用率显示

  3)随后查看发现172.18段交换机学习了6万多个MAC地址,172.19段的交换机也学习到了1.6万个MAC地址,远超所接入FSU动环设备的数量,遂对交换机设置访问控制策略对MAC地址进行过滤。经观察监控中断的告警频率较之前下降明显,每个小时在11条左右。

  

  表2 基站闪断分析表2

  4)通过对核心层交换机抓包进行分析,发现有从接入层A站和B站2个站对外发送大量的广播报文,经核实这2个站都为移交铁塔站点,底端FSU采集器配置被恢复成出厂设置(IP 地址改为初始地址192.168.100.100),但接入我公司SDH传输网络的E1线路未脱开,还可以登录,从而判断是这2 个站地址恢复出厂地址后,不在正常的172.18地址段中,导致一直发送广播报文,产生网络风暴现象,最终导致了批量闪断的产生。

  

  图3 广播风暴抓包

  在将A、B两站FSU连接我公司SDH传输网络的E1线拔掉后,经观察闪断现象已消失,再将步骤3中交换机的MAC地址安全策略关闭,经观察也未出现闪断告警,至此故障排查结束。

  2.2.2 问题分析

  在2G时代由于技术局限,采用SDH传输承载方式开通动环监控较多,因此历史遗留原因,我公司目前仍存在大量基站FSU承载于SDH传输网络,SDH传输方式主要是利用传统的SDH传输网络为底端每个FSU上行的传输线路分配E1链路,每条E1链路带宽2M,汇聚层及核心层经过了包括RC951、RC952等多个协议转换器在E1、以太网传输方式之间进行了多次转换,网络结构复杂,协议转换设备多且老化严重,导致故障点增多,排查困难,不便于维护。

  

  图4 SDH传输网络结构图

  随着技术的发展,PTN传输方式已是目前动环监控主流的传输承载方式,无需汇聚层及接入层复杂且多变的传输协议转换,直接从接入层FSU直连PTN环网络并上行至核心层的动环交换机,使得我们的网络结构简单化,减少了故障点。同时动环交换机针对每个上连基站FSU地址分配相应的VLAN,这样既利用了交换机硬件转发速度快的优势,也通过VLAN隔离避免了广播风暴问题。

  

  图5 PTN传输网络结构图

  3优化方案及效益分析

  3.1 优化方案

  3.1.1 方案一

  本方案通过针对172.18及172.19网段各个FSU地址分配独立的VLAN从而达到隔离的目的,避免网络风暴的产生。

  此方案为纯软件优化,不对现有网络传输方式进行更改,无需投入资源对现有接入层的FSU进行改造,也可达到避免网络风暴产生的目的。

  3.1.2 方案二

  目前我公司配置于172.18及172.19两个网段的FSU均承载于SDH传输网络,共计接入1000余个FSU,通过E1链路及汇聚层、核心层的多次协议转换上行至LSC。

  本方案针对172.18及172.19网段所有FSU配置PTN板卡,从接入层直连PTN网络,直接上行至核心层,核心层交换机采用H厂商的S5720交换机,每个地址分配一个VLAN阻隔网络风暴,并上连至动环监控LSC。

  此方案解决了现有动环监控多种传输方式并存的问题,简化了网络结构,将汇聚层及接入层大量协议转换设备略去,减少了故障点,并通过VLAN隔离杜绝了网络风暴产生的可能。

  3.2 效益分析

  我公司现网运行的1000余个协转设备投运时间超8年的超过半数,根据图6(电子产品的寿命曲线)所示,已到达耗损失效时期,故障率λ极速增高,据统计我司超期服役协转设备故障率λ已达2次/年,MTBF低至0.5。

  

  图6 浴盆曲线

  目前此类设备超半数早已过保,返修周期为1个月以上,MTTR(Mean Time To Repair,平均恢复时间)高达720以上。

  根据以上数据可测算出,现网超期服役的500台协转设备年维修费用如下所示:超期服役协转设备台数*设备故障率*维修单价=500*2*300=300,000元/年;且维修无法降低设备故障率,此笔费用每年均会产生。

  方案一并未对现网协转进行替换,仅通过划分VLAN避免了广播风暴的产生,无法避免协转设备故障及其所带来的维修费用。

  我司选择了方案二,通过将传输网络统一改为PTN方式开通,无需协转设备存在,一劳永逸,省去了协转设备维修费用。通过以上计算,节约费用约30万元/年。 相比原传输组网基站动环监控系统,基站动环监控系统的故障率将下降10%,系统支持多业务承载及接入,便于各种支撑业务的发展;另外PTN的大容量/高效承载特点解决带宽瓶颈问题、PTN监控设备解决接口接入问题、PTN基站动环监控组网网络解决通道问题、各业务IP合理分配及PTN交换机的3层交换功能确保业务安全分流、PTN网络GE口与PTN交换机的1+1 LAG保护方式提升安全保障等级。

  4小结

  通过该系统做到隐患提前呈现并预警,故障及时发现并反馈;从而解放人力,降低生产成本和维护劳动强度,大大提高维护工作效率和服务质量,为企业的业务发展打下良好的基础。动环监控系统已经是网络可靠的关键因素,随着动环监控技术的不断进步和软件技术的飞速发展,动环监控系统集中管理会不断地增强,监控内容的融合也会不断地加大。系统运行稳定性已成为动环监控系统维护工作中的重中之重。

  参考资料

  [1] 《中国移动动力环境集中监控系统-系统总体技术规范》

  [2] 《动力环境集中监控系统规范》

  [3] YD/T 5027-2005《通信电源集中监控系统工程设计规范》

公司地址:北京海淀区上地十街辉煌国际大厦 邮政编码:100085
电话:010-56025828 Email: ups6789@163.com 手机:18911981123(24h)备案号:京ICP备10217701号-1
©CopyRight 【北京旭祥瑞特】为您提供艾默生ups电源艾默生机房空调山特ups电源