01 ODN网络弱光运维现状
ODN网络是家庭宽带连接系统-无源光网络 (PON) 的重要组成部分,是连接局端 OLT 和用户 ONT 之间的光路通道,其质量直接影响整个PON系统的性能及可靠性。ODN光纤链路包括OLT PON口、ODF、主干光纤、一级分光器、分支光纤、二级分光器、入户光纤、ONU光模块等,主要涵盖以下设备:
可以看到,ODN网络设备均为无源设备,对无源设备进行弱光定位显然非常不易的。再从ODN网络连接图来分析光信号在 ODN 链路上传输损耗点:
并且光信号在 ODN 链路上传输的过程中,有一部分能量转化成热能或者被传输介质吸收、散射,从而造成信号强度不断减弱,即信号衰减,体现为光功率劣化即为弱光。为优化PON网络质量,对ODN光路耗损分析成为了当下PON网络运维的重点,又因是ODN网络中全为无源设备,其弱光定位与整治又是难点。传统ODN网络运维,缺乏有效预判和指导,通常依赖人工现场逐段排查检测ODN网络收发光功率,耗费大量时间和人力。
当前处理ODN弱光主要有以下几个难点:
①宽带速率持续提速—要求高
随着网络技术发展,用户网络带宽不断提高,正在从百兆向千兆、双千兆普及,新型家庭网关以及各种应用业务对网络质量提出更严格的要求。
②运维聚焦ODN弱光—维护难
为了进一步提升用户有线业务感知,把优化网络质量的焦点从用户侧 ONT 设备收光转移到整个 ODN 网络光路损耗,这对于有线业务运维来说,增加巨大运维难度。
③传统人工处理方式—效率低
ODN 网络故障处置依靠维护人员现场逐步排查检测,缺乏预判和指导手段,处理耗费大量人力。虽然现在业内已能根据人工经验设定固定规则逐渐自动化进行ODN弱光定界定位,但依旧存在定位不准等问题。
针对上述问题,本文对ODN网络弱光智能化定界及整治进行探索。
02 整体思路
分析ODN网络光功率传播规律,采集端到端光路收发光数据,同时定时对ODN网络进行弱光巡检,采集汇聚相关资源拓扑、告警、光功率等数据;建立宽带上网ODN网络弱光聚类定界模型,基于预测模型分析出弱光范围;针对弱光范围,派单闭环整治,实现ODN网络高效运维。
定界知识库构建模型:根据不同原因引起的光衰时,各设备节点的的关键特征表现,构建宽带上网ODN网络弱光聚类定界知识模型,自动精准定界弱光范围。
高效运维:基于宽带上网ODN网络弱光聚类定界知识模型,精准分析出弱光范围,快速排查故障点。
闭环处理:根据分析出的弱光范围,及时进行派单整治,并将处理结果反馈到模型进行不断调优,形成整个方案的闭环。
03 实现要点
弱光样本数据采集
采集近三个月历史弱光整治工单数据作为知识库训练样本,并采集当前ODN网络的资源信息、拓扑信息、以及网络性能、告警等数据,建立知识库模型标签体系。
构建弱光定界库
基于历史弱光定界结果数据,结合OLT/一级分光器/二级分光器/ONU的收发光数据、损耗绝对值/相对值、弱光比例等特征信息,梳理不同原因引起的光衰时,各设备节点的的关键特征表现,初步形成弱光定界知识体系。
➡️步骤一:采集ODN网络拓扑数据,包含ODN网络从上至下的全链路光功率分析设备关联关系:OLT/PON端口、主干光纤、分支光纤、入户光纤、ONU。
➡️步骤二:以ODN网络拓扑数据为基准,采集光功率、光损耗、弱光比例等数据筛选出弱光特征信息。
➡️步骤三:弱光特征信息与历史弱光定界结果数据关联匹配,梳理不同原因下的弱光特征表现。
整理结果样本示例:
知识相似度检索
基于构建的弱光定界知识体系,可采用相似度算法进行检索,从而进行弱光定界。
当有其他用户发生光衰时,采集当前ODN网络关键弱光特征数据,基于相似度计算,使用faiss架构对知识库里的特征信息进行高校检索匹配,匹配度最高的特征对应的弱光定界原因,即为该用户弱光定界原因。
建议采用Faiss向量检索,Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前较为成熟的近似近邻搜索库。
采用Faiss能根据弱光定界场景的多项特征快速检索,其具有以下特点:
全量构建索引:基于原始向量,train训练并且add构建,生成Faiss索引文件。
增量构建索引:后续若有新增向量,只需add操作,即可对Faiss索引文件做增量更新。
向量检索查询:提供目标样本向量信息并检索索引文件,获取与目标样本最为相似的N个向量索引。
应用:从模型建立到闭环整治
构建宽带上网ODN网络弱光聚类定界模型,由ODN弱光定时自动巡检,采集告警、资源、性能数据归一化处理后,依赖弱光聚类定界模型,判断是否存在弱光问题,判断弱光范围。
采集数据:对接外系统获取模型输入数据,包含告警、资源拓扑、性能数据等。
模型计算:使用宽带上网ODN网络弱光聚类定界模型快速定界弱光范围,并输出结果进一步处理。
闭环处置:通过模型计算的结果,确定弱光范围,派出整治工单及时处理,并将处理结果反馈给模型。
持续调优:定期收集弱光定界数据,用以更新、补充知识库。包括新增的弱光产生原因、已有原因由设备老化引起的整体数据分布的变动。
本方案解决ODN网络定界弱光范围难和不准的问题,采用构建弱光定界体系知识库能快速进行故障范围的定界定位,以此提高故障处理的效果,在未来可以将知识库体系的应用范围扩大。如在ODN上游设备和家庭网络侧终端设备都能采集相关故障场景特征数据,并结合用户行为等特征,构建有线业务网络其他故障场景的知识体系,解决更多的故障场景。