第3章


全光接入网技术基础
本章主要介绍F5G全光接入网的一些重要的基础技术,全光接入网技术全景图如图31所示。其中带“*”号标记的是比较重要的基础技术,本章会重点介绍。


图31全光接入网技术全景图




3.1ODN相关技术


3.1.1ODN网络概述
众所周知,PON网络就是无源光网络,是从中心机房(CO)的光线路终端(OLT),经过光分配网络(ODN),到达用户侧的光网络单元(ONU)。ODN网络位于中心机房和用户侧的中间,提供光传输通道,起到分配光纤、保护光纤、光纤连接、保护连接点等作用。
1. 网络结构
ODN从局端到用户终端可分为两点三段,两点指光分配点和光接入点,三段分别为馈线光缆、配线光缆和入户光缆,如图32所示。


图32ODN网络结构示意图


ODN节点产品主要用于光纤光缆的接续保护,实现从OLT到ONT的链路连接,根据网络节点位置和功能不同包含光缆、光配线架(Optical Distribution Frame,ODF)、光缆接头盒(Closure)、光缆交接箱(Fiber Distribution Terminal,FDT)、光分路器(Splitter,SPL)、分纤箱(Fiber Access Terminal,FAT)、光纤终端盒(Access Terminal Box,ATB)。
(1) 光缆。
为使光纤达到工程应用的要求,通过套管、绞合、套塑、金属铠装等措施,把若干根光纤组合在一起,就构成了光缆。光缆能承受实用条件下的抗拉、抗冲击、抗弯、抗扭曲等机械性能,能够保证光纤原有的传输特性,并且使光纤在各种环境下可靠工作。常见的光纤类型包括三种,分别是层绞式、骨架式及中心束管式结构,可通过变换不同的光缆组成部件(如外护套)适应不同的应用场景。光缆按应用场景可分室外光缆和室内光缆。
① 室外光缆应用场景包括直埋、管道、架空及气吹等特殊应用,根据不同的应用场景,光缆的结构性能也有所不同。
② 室内光缆的应用主要可以分为室内多芯缆及蝶形入户缆。室内多芯缆主要用于入户前的楼内的垂直布线或水平走线,这种光缆通常是干性结构,可以避免垂直布线时油膏下沉失去防水性能,由于楼内场景多拐角,光缆的柔软性也要求更高。蝶形入户缆即我们平常说的皮线光缆,主要用于最后一段的入户光缆布放,这种光缆通常每根为1芯或2芯,为了使施工更便捷,这种光缆的设计非常易于开剥,一般只需从中间撕开即可。
(2) 光配线架(ODF)。
ODF主要部署在CO机房和多住户单元(MultiDwelling Unit,MDU)场景地下室,实现光纤通信系统中局端主干光缆的连接、成端、分配和调度功能。在ODN网络中,ODF配合光分路器,同时可实现分光功能。ODF的关键技术是高密设计和光纤调度的便利性。
(3) 光缆接头盒(Closure)。
光缆接头盒主要部署在室外架空、抱杆和人井,实现光缆的接续、分歧和配线入户功能。在ODN网络中,配合光分路器,可实现分光功能; 配合配线面板,可实现光缆成端、调配功能。光缆接头盒由于长期在室外恶劣环境使用,为ODN网络中可靠性要求最高的节点产品,可靠性方面需重点关注IP68密封性能、抗化学腐蚀、抗UV、高温高湿度等性能,产品结构方面需关注高密度和操作性。
(4) 光缆交接箱(FDT)。
FDT主要部署在室外街边场景,实现馈线光缆和配线光缆的接续、成端、跳接功能。光缆引入光缆交接箱后,经固定、端接、配线后,使用跳纤将馈线光缆和配线光缆连通。在ODN网络中,FDT配合光分路器,同时可实现分光功能。FDT由于长期在室外使用,可靠性方面需关注防水汽凝结、IP55/IP65密封性能、防虫害和鼠害、高温高湿和抗冲击损坏等性能,产品方面需关注高密度和施工效率。
(5) 分纤箱(FAT)。
在ODN网络中,FAT通常配合光分路器,作为第2级分光点使用,根据部署位置分为室内FAT和室外FAT两种。
① 室内FAT主要为楼道弱电井和室内挂墙安装,实现配线光缆与入户光缆的接续、分纤、配线等功能。
② 室外FAT主要为室外挂墙和抱杆安装,由于长期在室外使用,需具备抵抗剧变气候和恶劣工作环境的能力。
(6) 光纤终端盒(ATB)。
ATB主要部署在室内墙面或弱电箱内,用于室内入户光缆的成端,成端端口通过跳纤与ONT进行连接。由于是室内使用,产品方面主要关注外形设计,适应家居装修风格。
2. 设备部署场景
ODN设备部署场景比较复杂,从CO机房到用户室内整个网络节点都需要布放,如图33所示。


图33ODN设备部署场景


(1)  CO机房。
CO机房场景采用ODF实现光纤通信系统中局端主干光缆的连接、成端、分配和调度功能。在ODN网络中,ODF也可放置光分路器,实现分光功能。
当远端机房(楼内设备间)需要大容量光纤处理工作时,在安装空间允许的前提下,也可使用ODF设备,根据容量的不同,ODF可分为光纤配线柜/架和光纤配线箱两种。
(2) 户外地下。
户外地下场景采用光缆接头盒实现光缆的接续、分歧功能。
在ODN网络中,配合光分路器,可实现分光功能; 配合配线面板,可实现光缆成端、调配功能。
光缆接头盒配合相应的安装附件,可实现人井、手井、抱杆、架空、挂墙、直埋等户外场景,具有防水汽凝结、防水和防尘、防虫害和鼠害、抗冲击损坏能力强等特点。
(3) 户外街边。
户外街边场景采用FDT实现馈线光缆和配线光缆的接续、成端、跳接功能。光缆引入光缆交接箱,经固定、端接、配线后,使用跳纤将馈线光缆和配线光缆连通。
在ODN网络中,FDT也可配合光分路器,实现分光功能。FDT主要应用于户外环境,需具备能抵抗剧变气候和恶劣工作环境、防水汽凝结、防水和防尘、防虫害和鼠害、抗冲击损坏能力强等特点。
(4) 户外抱杆、挂墙。
户外抱杆、挂墙场景采用户外型FAT,实现配线光缆与入户光缆的接续、分纤、配线等功能。在ODN网络中,FAT配合光分路器,同时可实现分光功能。
FAT具有独立的入户光缆进出缆孔,可提高光缆固定和防护的可靠性,有利于后期维护。室外FAT主要应用于户外环境,需具备抵抗剧变气候和恶劣工作环境的能力,如防水汽凝结、防水防尘、防虫害和鼠害、抗冲击损坏等。
(5) 楼内竖井。
楼内竖井场景采用室内FAT,实现配线光缆与入户光缆的接续、分纤、配线等功能。
(6) 室内。
室内场景采用ATB进行光缆的成端和保护。ATB根据使用场景,可分为室内终端盒和弱电箱两种。
室内终端盒ATB用于室内入户光缆的成端,起到尾纤盘储和保护接头的作用,外形美观,适用于家居环境。
弱电箱用户终端盒(Customer Terminal Box,CTB)实现ONT、入户光缆的熔接配线、ODN配电系统等产品的集成安装,可起到完成集中管理和美化户内环境的作用。
3.1.2挑战与要求
在全光接入网络建设中,“最后一公里”光纤的铺设和接入是最复杂的环节,也是最难啃的骨头,涉及路权获取、挖沟埋缆、物业沟通、光纤入户、业务发放等问题。
路权、土建和入户成本占光接入网络建设总成本的大部分。土建包括网络覆盖阶段的路权获取、挖沟和埋管等,入户则包括了用户放装的所有操作,如光纤入户挖沟、埋管和光纤安装等。其中,路权和土建的成本平均占比为44%,占比最高,弹性也最大,不同国家占比从15%到70%不等,入户平均成本占比为15%。
1. 面临的挑战
1) 施工路权获取周期长、费用高
在很多国家的城市区域,根据市政的要求,不允许架空走线或者外墙走线,必须利旧地下管道光纤入户,如果管道没有空间就必须道路开挖,而道路开挖的路权获取难度较大,一般需要提前数月向市政提出申请。更有甚者,要求每天的施工时间都有限制,在早晚的上下班高峰期,不允许施工。
所以在ODN规划中应尽量利用现有的管线资源(人井、通信杆、室外机柜等),合理路由,避免基础设施完全新建。
2) ODN挖沟土建成本高
FTTH建设成本最高的是ODN外线土建工程部分。为了避免租用管道,优选自建光纤管道,造成施工周期长、成本高、效率低。自建管道人工挖沟带来的工程量巨大,全程管道铺设,使用大量水泥人井,施工复杂,建设成本非常高。
所以在ODN施工中在不能利用现有管线资源的情况下,应尽量使用高效的施工工具,统筹安排,缩短施工时间,减少现场窝工。
3) 用户接入点到ONT(Home Connect,HC)段施工效率低
除了路权审批流程复杂、获取周期长(60~90天)、缺少通信管线的规划和标准外,FTTH入户难也是另外一个重要的障碍,由于没有施工标准规范、缺少易用的FTTH入户安装工具,加上安装人员经验不足,其首次安装FTTH的成功率只有30%左右,一个施工队一天仅能完成两户FTTH入户安装。
所以应针对不同的场景(管道、外墙、暗管、波纹管、架空共5种场景)使用不同的入户套装辅料包,同时加强对施工队伍的培训,保证入户施工的质量,提高一次入户施工的成功率。
4) 连接可靠性和资源管理的挑战
ODN建设最重要的是光纤连接,光纤连接一般通过熔接和现场做接头,对施工人员技能要求较高,现场连接的质量很难保证,影响整个网络长期运行的损耗稳定。
ODN光纤网络属于哑资源,结构不可视。端口调度管理依赖人工记录,人工记录很容易出错,导致系统资源不准,端口资源沉淀。
2. 全光接入网对ODN网络的要求
1) 灵活性、可扩展性
现网ODN网络作为基础设施网络,除了满足GPON业务的需求外,需要考虑有一定光功率预算余量用于未来10G GPON/50G PON的业务平滑演进需求。全光演进场景下,不但要考虑FTTH业务,还需要综合考虑家庭和企业业务,避免光纤光缆重复铺设,节省投资和上市时间(Time to Market,TTM)时间。这就要求ODN网络支持综合业务接入,且网络是共享的、可灵活调度的、可灵活扩容的。

2) 易部署
ODN大部分都是外线施工(Outside Plant,OSP),涉及的工程场景复杂,施工人员的素质参差不齐,导致部署周期长。ODN部署应越简单越好,对施工人员的技能要求应越低越好,便于快速部署,缩短TTM,实现网络快建快赢。
3) 可维护性
ODN网络应具备可维护性,在网络出问题时,能快速定位,快速修复故障。
4) 可靠性
ODN是无源设备,是全光接入网业务发展的基石,在全生命周期内,应具备高可靠性,做到 “一次铺设,二十年不动”,避免因可靠性问题而需要重建,浪费投资。
3.1.3预连接技术
在工程施工中,光纤熔纤一直是ODN施工中技术含量较高的工作,需要训练有素的熔纤技工操作,所以造成光缆部署不仅施工成本高,进度慢,熔接质量和效率也经常成为工程瓶颈。为此早在2000年,行业率先提出预连接的概念并逐步产品化。预连接是将光缆在工厂预制好满足室外防护和环境使用要求的连接头,施工现场将预制缆直接插入FAT外露的适配器上,实现光纤对接功能。预连接技术具有如下特点和价值。
(1) 无须熔接,无须专业技术工人,普通工人即可实现光缆的接续工作。
(2) 所有FAT适配器外露,光纤连接时无须打开设备。
(3) 施工现场即插即用,省去熔接场景复杂的光缆开剥和光纤管理工作,施工效率高。
(4) 设备安装和预连接缆铺设全解耦,可以并行施工。
3.1.4不等比分光
众所周知,分光器是ODN网络最核心的无源光器件,PON口输出的光信号通过单根光纤传递到指定位置后通过分光器分支成n根光纤,从而实现1个PON口接入多个用户的功能。传统PON网络中分光比最多1∶64,常用的分光比有1∶8+1∶8、1∶4+1∶8两级分光以及1∶64一级分光,如图34所示。


图34等比分光应用场景


传统的ODN网络中使用的分光器都是等比的,分光器输出的每根光纤功能也都相同,因此分光器下连接的盒子均为并联关系。以1∶8+1∶8两级分光为例,如图35所示,光缆在FDT中经过一级分光后,需要采用多芯光缆将分光器端口引出,然后在需要安装FAT的位置将多芯光缆剥开,剪断一根光纤安装1个1∶8分光器,剩余光纤继续往下走,直到分光器端口,等比分光FDT和FAT连接如图36所示。


图35典型的等比两级分光原理图





图36等比分光FDT和FAT连接图


在网络建设过程中人们发现传统ODN部署最烦琐,工作量最大的是在配线段,也就是FAT处的布放,它的部署主要存在如下几个问题。
(1) 由于一级分光器往下的端口是并联关系,因此需要使用多芯光缆(12/24芯)来串联多个FAT。
(2) 每个FAT都需要将多芯光缆开剥,并找出对应的光纤进行熔接,还需要管理未熔接的剩余光纤,操作烦琐,费时费力。
(3) 多芯光缆中已经使用的光纤在后续光缆路由中是无用的,这无疑造成光缆的浪费。
基于传统ODN布放存在的问题,业界提出了一种基于不等比分光器的组网方案,如图37所示。该方案改变了传统等比分光的组网逻辑,在典型组网场景中它在FAT中的1∶8分光器前面增加了一个1∶2不等比分光器,典型情况下该分光器按照70%和30%的比例将输入光功率一分为二,30%的光功率分给1∶8分光器,70%的光功率继续往下走,串联下一级FAT。该方案一条链路最多可以串联4个8口FAT,因此一条链路共下挂4×8=32个用户,实现1∶32的总分光比,如果需要实现1∶64的分光比,需要在FDT位置放置一个等比的1∶2分光器,一个PON口下挂两条32个用户的链路,实现1∶64的总分光比。


图37不等比分光方案示意图


不等比分光方案的优点如下。
(1) 由于采用了不等比分光技术,可以采用单芯光缆替代原12/24芯多芯光缆串联多个FAT,节省光纤资源,使成本更低。
(2) 在单芯光缆的基础上结合预连接技术,如图38所示,可以省去原来FAT开剥光缆、开箱熔接和管理光缆的工作,可使FAT施工效率提升70%。


图38基于预连接技术的不等比分光组网示意图


从前面我们可以看到,不等比分光技术需要在FAT安装一个1∶2分光器和1∶8分光器,这两个分光器需要通过熔接方式连接起来。相对传统组网方式的1∶8分光器,其器件更多,增加了熔接操作,从而降低了方案竞争力,基于该方案的缺点,人们发明了1∶9的分光器,通过平面波导技术(Planar Lightwave Circuit,PLC)将两个分光器集成在一个PLC芯片中,让其与1∶8分光器大小和形态一致。1∶8等比分光器原理图如图39所示。


图391∶8等比分光器原理图



基于1∶9分光器的ODN不等比方案是最为典型的场景,实际应用中根据用户端口数量的不同可能还会涉及1∶5、1∶17等不同分光比的场景,可根据组网需要进行选择,1∶9不等比分光器原理图如图310所示。


图3101∶9不等比分光器原理图


3.1.5数字化技术
ODN是无源网络,其无源特性决定了其管理无法自动化,必须依赖于人工。ODN资源管理包含建设和装维两阶段,具体管理内容如下。
(1) 机房到用户接入点(Home Pass,HP)建设阶段ODN资源数据录入,包括ODN设备、光缆路由、用于HC放号的纤芯关系、光纤分纤箱FAT端口状态等。
(2) 放号和运维阶段FDT和FAT端口状态变化和纤芯关系变化管理。
相对而言,放号和运维阶段纤芯关系变化管理和FDT/FAT端口变化管理难度最大,必须有强流程和规范保障,才能提高资源管理准确率。自ODN诞生以来,ODN哑资源数据不准一直是运营商面临的主要难题之一。当前ODN哑资源管理主要存在如下问题。
(1) 资源不准确,信息错乱缺失,准确度只有30%~60%,光纤端口资源依赖小区经理人工管理,不可控。
(2) 业务开通难,拆机不拆线、端口虚占,资源沉淀10%~20%,线路弱光,弱光率4.4%,业务开不通。
(3) 定障效率低,排障难,65%的故障需要上门或上站,运营支出(Operating Expense,OPEX)高。
1. 数字化ODN概述
数字化ODN是在保证ODN无源的基础上,在规、建、装、维、营全生命周期避免ODN资源数据人工录入,解决FDT/FAT端口状态变化由人工管理带来的不确定性和效率低问题。数字化ODN主要具有如下特点。
(1) 数据流转无纸化。
基于AI的图像识别,快速获取ODN设备和线缆连接关系,生成完整的ODN资源信息,便于资源同步。
(2) 资源变化可自动感知。
ODN资源变化主要是放号和运维阶段FDT和FAT端口状态变化和纤芯关系变化,数字化ODN要能自动感知这些变化并自动刷新资源管理数据库,保证数据库数据和现场数据一致性。
(3) 光路状态可视。
ODN是构建可靠、稳定、灵活FTTH网络的基石,光路状态直接影响FTTH的放号和用户业务体验。数字化ODN除了要解决资源数据准确性的管理外,还要能感知光路状态,做到光路状态实时可视,包括光路路由、光路健康状态的可视。
2. 图像识别技术
随着人们对带宽要求的逐步提升,光纤接入网络由于其无源技术的先进性正逐步替代铜线网络。但是海量无源ODN端口需要通过人工来管理维护,给运营商带来了极大运维挑战。目前基于图像识别技术的数字化ODN是最好的ODN端口管理技术,图像识别技术主要实现如下两个功能。
(1) 识别ODN设备上的二维码,获取ODN相关信息(包含设备类型、设备规格、生产日期等信息)。
(2) 自动锁定并识别FAT/FDT端口状态(占用或空闲,用于放号时资源匹配),以及端口连接的光缆条形码(用于确定纤芯关系)。 
如图311所示,它从根本上解决了光纤网络基础设施的数字化问题。

为了使光纤接入网络全面实现数字化,数字化ODN设备上预制了图像识别所需要的三个关键因素,如图312所示。
(1) 设备二维码: 包含的信息能够体现设备的型号和规格,全球唯一的内容是其区别于其他设备的标识信息。



图311图像识别技术





图312图像识别关键因素


(2) 预连接端口: 图像识别依赖采集图像信息进行处理,合理的端口布局是数字化识别的前提。应用(Application,App)通过AI图像识别算法,能够精确地识别出设备的类型、端口占用状态、端口连接线缆条码等关键信息,并将信息回传到后台系统,实现ODN设备资源的精确管理。
(3) 预制缆条码: 配线缆采用双端预制缆,两端自带相同的一维条码。入户缆单端预制一维条码。

数字化ODN资源录入和管理分为网络建设阶段和业务发放阶段,不同阶段负责不同的资源录入和管理。
(1) 网络建设阶段: 手机App可快速拍照识别ODN设备和线缆,还原设备端口拓扑、设备类型及设备端口与配线编码对应信息,装维人员可以快速、准确地完成ODN资源信息录入,如图313所示。


图313网络建设阶段原理


(2) 业务发放阶段: 通过AI智能识别,快速建立放号设备、放号端口及入户线缆拓扑关系,实现快速业务发放及数据准确录入,如图314所示。


图314业务发放阶段原理


3. 光虹膜技术
基于图像识别技术的数字化ODN技术,可以实现FTTH物理端口的自动化录入、管理和维护,但是无法解决运营商网络运维过程中的状态实时监控、故障预知和故障诊断等问题。因此,基于光虹膜技术的数字化ODN应运而生。
光虹膜技术除了可远程实时感知资源变化外,还可以实现光路状态可视,解决远程自动验收、远程自动评估、光路故障分界定位、光路健康状态感知等问题。
如图315所示,光虹膜数字化ODN技术是在ODN网络中部署具备光虹膜的分光器,每个分光器端口上增加唯一编码的标记,在OLT上增加用于数字化管理的光路人工智能(Optical Artificial Intelligence,OAI)单板,同时ONT进行必要的管理适配。网管系统通过OAI单板实时采集每一个分光器端口和ONT的连接关系,可实现如下功能。
(1) 网络拓扑自动还原,可自动建立PON口、分光器端口和ONT之间的对应关系。







图315光虹膜技术应用


(2) 运维离线在线,OAI板可以远程采集ODN链路总损耗和分光器端口位置损耗,用于网络建设阶段的自动验收、运维阶段链路质量恶化预警和故障位置精准分责定位。


3.2PON通用技术


PON是一种点到多点(PointtoMultipoint,P2MP)结构的无源光网络,是目前应用范围最广的光接入技术。
随着宽带业务的普及和光进铜退的趋势,运营商对业务的传输距离、带宽、可靠性和低运营成本提出了越来越高的要求。PON技术的以下特点满足了这些要求。
(1) 更远的传输距离: 采用光纤传输,接入层的覆盖半径最大可达60km,可以解决双绞线“距离和带宽的矛盾”。
(2) 更高的带宽: 10G PON支持9.95328Gb/s线路速率,满足用户对高带宽业务的需求,如高清电视、实况转播等。
(3) QoS提供灵活的全业务体验: 提供区分用户和用户业务的流量控制,保证多用户的多业务带宽,为不同的用户业务提供差异化服务。
(4) 分光特性: 局端单根光纤经分光后引出多路到户光纤,支持1∶128的分光比,节省主干光纤资源,降低运营维护成本。
3.2.1PON技术概述
GPON、10G GPON、50G PON、EPON和10G EPON是当前主流的PON技术,本节重点介绍它们的基本原理和技术特点,包括工作波长、工作速率和帧格式。
1. GPON
国际电信联盟电信标准部(International Telecommunications UnionTelecommunication Standardization Sector,ITUT)定义了GPON系列标准,包括GPON、10G GPON系列(单波长为10Gb/s,包括非对称的XGPON、对称的XGSPON和多波长的时分波分堆叠复用PON(Time Wavelength Division Multiplexing Passive Optical Network,TWDM PON)),后续会演进到更高速率的50G PON。
GPON采用了P2MP结构的无源光网络,能够提供下行2.48832Gb/s、上行1.24416Gb/s的速率。
GPON标准是由ITU制定的,在ITU中,运营商占据主导地位,更关注已有业务在GPON上的支持,因此GPON标准除了关注以太网业务在PON上的传输外,也关注以前的语音、E1专线等各种业务在PON上的承载,对PON上承载业务的QoS保证等提出了较高的要求。
GPON更适用于支持多业务承载,是目前主流的FTTH建设方案,并且已具有成熟的产业链,同样情况下的建设和部署成本更具竞争力。
如图316所示,GPON采用了简单、高效的适配封装,引入了GEM(GPON Encapsulation Mode)帧的封装,提供了更高的带宽利用率。GEM帧是GPON中最小的业务承载单元,所有业务都封装在GEM帧上进行传输,通过GEM Port标识。
(1) 每个GEM Port由一个唯一的Port ID来标识,由OLT进行全局分配,即每个GPON端口下的每个ONU不能使用Port ID重复的GEM Port。
(2) GEM Port标识的是OLT和ONU之间的业务虚通道,即承载业务流的通道。


图316以太网帧映射到GPON GEM帧


除了上述的将以太网帧映射到GPON GEM帧之外,GPON的GEM帧还可以承载传统电话业务(Plain Old Telephone Service,POTS)、E1、T1等多种格式的信元,可以更好地支持多种业务承载。
GPON上行方向采用1310nm波长窗口(1290~1330nm波长),下行方向采用1490nm波长窗口(1480~1500nm波长),也可以和有线电视(Cable TV、CATV)业务共存(CATV业务使用1540~1560nm波长)。
2. 10G GPON
随着宽带业务的发展,GPON也存在带宽不足的情况,所以10G GPON技术已经在高价值区域规模部署,10G GPON分为非对称模式(XGPON)和对称模式(XGSPON)两种不同的模式。
(1) XGPON的下行线路速率是9.95328Gb/s,上行线路速率是2.48832Gb/s,主要是应用于家庭用户的上网场景。
(2) XGSPON的下行和上行线路速率都是9.95328Gb/s,该模式除了满足家庭用户的上网场景之外,也可以用于企业用户的接入应用,还可用于移动承载等。
如图317所示,10G GPON(XG(S)PON)由于采用了和GPON不同的波长,所以也可以支持XGPON ONU、XGSPON ONU和GPON ONU在同一个ODN下共存,支持不同种类的ONU平滑演进。其中,XG(S) PON和GPON通过一个外置或者内置的合波器共存。



图317GPON和XG(S)PON上下行的波长


XG(S)PON和GPON的上下行方向都是通过波分共存。
(3) XGPON和XGSPON的下行速率都是9.95328Gb/s,下行方向采用1577nm波长窗口(1575~1580nm波长),与GPON的下行1490nm波长窗口(1480~1500nm波长)并不冲突,通过波分方式共存。
(4) XGPON ONU的上行速率是2.48832Gb/s,XGSPON ONU的上行速率是9.95328Gb/s,两者都是采用1270nm波长窗口(1260~1280nm波长),和GPON的1310nm波长窗口(使用1290~1330nm波长)波分共存。XGPON ONU和XGSPON ONU采用相同的波长窗口,采用时分共存,不同的ONU占用不同的时隙发送报文。
3. 50G PON
随着PON业务承载内容的不断丰富,需要在10G GPON的基础上发展下一代的更高速的PON系统。特别地,针对5G移动前传和企业专线业务,需要支持到50Gb/s的PON口速率。
50G PON分为非对称模式和对称模式两种不同的模式。
(1) 非对称50G PON的下行线路速率是49.7664Gb/s,上行线路速率是24.8832Gb/s或12.4416Gb/s,主要是应用于普通企业客户或未来的家庭用户的上网场景。
(2) 对称50G PON的下行线路速率是49.7664Gb/s,上行的线路速率也是49.7664Gb/s,该模式除了满足家庭用户的上网场景外,也可以用于企业用户的接入应用,还可用于5G移动前传等。
如图318所示,50G PON的下行中心波长为1342nm,上行波长有两个选项与现有的GPON或者10G GPON网络波分共存。当与GPON网络共存时,上行采用和GPON不同的波长,中心波长为1300nm, 此时可以同时支持GPON ONU和50G PON ONU在同一个ODN下共存; 当与10G GPON网络共存时,上行采用和10G GPON不同的波长,中心波长为1270nm,此时可以同时支持XGPON ONU、XGSPON ONU和50G PON ONU在同一个ODN下共存,支持不同种类的ONU平滑演进。其中,共存通过一个外置或者内置的合波器共存。


图31850G PON上下行的波长


50G PON和现有的GPON或10G GPON网络的上下行方向都是通过波分共存的。50G PON上行的三种速率的ONU通过时分共存,不同的ONU占用不同的时隙发送报文。
4. EPON
电气电子工程师协会(Institute of Electrical and Electronics Engineers,IEEE)组织定义了EPON系列的标准,包括EPON、10G EPON,以及后续将要演进到的50G PON。
EPON是基于以太网的PON技术,将以太网和PON技术结合,在物理层采用PON技术,在数据链路层使用以太网协议,利用PON的拓扑结构实现以太网接入。
EPON的帧结构主要是在以太网802.3协议的帧结构上进行扩展,充分利用了原有的协议资源,降低了协议的复杂度,EPON帧结构如图319所示。


图319以太网帧与EPON帧结构比较


LLID为逻辑链路标识,OLT通过此ID信息与不同的ONU建立点对点逻辑通信链路。EPON标准将以太网帧的前导码做了简单的复用,将LLID信息写入了以太网帧的前导码中,以2字节来标识,范围为0~0x7FFF。其中0x7FFF用来标识广播链路,其他用于单播链路。
EPON的线路速率是对称1.25Gb/s,上行方向采用1310nm波长窗口(1260~1360nm波长),下行方向采用1490nm波长窗口(1480~1500nm波长),如果采用第三波长方式实现CATV业务的承载,则使用1540~1560nm波长。
EPON目前的应用市场范围相对较窄,主要用在中国、日本、韩国运营商市场,以及一些Cable业务运营商市场。
5. 10G EPON
随着宽带业务的普及和互联网业务的蓬勃发展,用户对带宽的需求不断提升,原有EPON带宽已经不能满足最终用户的需求,需要10G EPON技术提供更高的带宽。
10G EPON分为非对称模式和对称模式两种模式。
(1) 10G EPON非对称模式: 下行线路速率是10.3125Gb/s,上行线路速率是1.25Gb/s,主要应用于家庭用户场景。
(2) 10G EPON对称模式: 下行线路速率是10.3125Gb/s,上行的线路速率也是10.3125Gb/s,该模式除了满足家庭用户场景外,也可以满足企业用户的接入应用。
10G EPON支持10G EPON ONU和EPON ONU在同一个ODN下共存,支持不同种类的ONU平滑演进。10G EPON和EPON下行方向通过波分共存,上行方向通过时分共存。EPON和10G EPON上下行的波长如图320所示。


图320EPON和10G EPON上下行的波长


(1) 10G EPON非对称模式: 下行方向采用1577nm波长窗口(1575~1580nm波长),与EPON的下行1490nm波长窗口(1480~1500nm波长)不冲突,所以在下行方向是通过波分方式共存的。10G EPON非对称ONU的上行和EPON的上行线路速率都是1.25Gb/s,并采用同样的1310nm波长窗口(使用1260~1360nm波长),EPON ONU和10G EPON ONU在上行方向通过时分方式共存。
(2) 10G EPON对称模式: 下行方向和非对称模式的下行是相同的,均采用1577nm波长窗口,与EPON的1490nm波长窗口进行波分共存。10G EPON对称模式的上行速率由1.25Gb/s提升至10.3125Gb/s,并选用了1270nm波长窗口(1260~1280nm波长),10G EPON OLT的接收侧采用宽接收,支持1260~1360nm的波长范围,故对称10G EPON ONU和EPON ONU此时必须通过时分方式进行共存。

3.2.2PON关键技术
1. 测距技术
各个ONU到OLT的逻辑距离并不完全相等,因此信号到达OLT的时间也并不相等。同时,OLT与ONU的环路时延(Round Trip Delay,RTD)也会随着时间和环境的变化而变化。因此在ONU以时分多址(Time Division Multiple Access,TDMA)方式(即在同一时刻,OLT一个PON口下的所有ONU中只有一个ONU在发送数据)发送上行光信号时可能会出现碰撞冲突,如图321所示。


图321无测距技术数据传输


为了保证每一个ONU的上行数据在光纤汇合后进入指定的时隙,彼此间不发生碰撞,且不要间隙太大(间隙过大,会导致带宽浪费),OLT必须对每一个OLT与ONU之间的距离进行精确测定,以便控制每个ONU发送上行数据的时刻。
如图322所示,OLT在ONU第一次注册时就会启动测距功能,获取ONU的往返延迟RTD,计算出每个ONU的物理距离,根据ONU的物理距离指定合适的均衡时延(Equalization Delay,EqD)参数。


图322测距技术数据传输


OLT通过调整均衡延时参数,使得各个ONU发送的数据帧同步,保证每个ONU发送数据时不会在分光器上产生冲突。相当于所有ONU都在同一逻辑距离上,在对应的时隙发送数据即可,从而避免上行光信号发生碰撞冲突。
2. 突发光电技术
PON上行方向采用时分复用的方式工作,每个ONU必须在许可的时隙才能发送数据,不属于自己的时隙必须关闭光模块的发送信号,才不会影响其他ONU的正常工作。
对于OLT侧上行接收,必须要根据时隙进行突发接收每个ONU的上行数据,因此,为了保证PON系统的正常工作,ONU侧的光模块必须支持突发发送功能,OLT侧的光模块必须支持突发接收功能。
ONU的光模块应支持快速地打开和关闭突发发送功能,防止本ONU的发送信号干扰到其他的ONU。非突发发送和突发发送的数据传输如图323所示。


图323非突发发送和突发发送的数据传输


OLT侧需要支持突发接收功能。由于每个ONU到OLT的距离不同,每个ONU到达OLT的光信号衰减也是不同的,这就导致OLT在不同时隙接收到的光信号的功率是不同的。这就给OLT光模块接收提出了更高的要求: 接收模块能在各个ONU上行时隙切换的较短时间内快速动态调整接收阈值,使其能正确接收到不同ONU的光信号。
如果OLT侧的光模块不具备光功率突变的快速处理能力,则会导致距离较远、光功率衰减较大的ONU的光信号到达OLT时,由于光功率电平小于阈值而恢复出错误的信号(高于阈值电平才认为有效,低于阈值电平则无法正确恢复)。
3. 动态带宽分配技术
PON上行方向是多个ONU通过时分复用的方式共享的,对数据通信这样速率多变的业务很不适合。如果按业务的峰值速率静态分配带宽,则整个系统带宽很快就被耗尽,带宽利用率很低,所以需要采用动态带宽分配技术,提升系统的带宽利用率。
对于从ONU到OLT的上行传输,多个ONU采用时分复用的方式将数据传送给OLT,必须实现对上行接入的带宽控制,以避免上行窗口之间的冲突,DBA动态带宽分配技术在OLT系统中专用于带宽信息管理和处理,是一种能在微秒或毫秒级的时间间隔内完成对上行带宽的动态分配的机制。
在OLT系统中,在上行方向可以基于各个ONU(GPON可以基于更细粒度)进行流量调度。DBA的实现过程如图324所示。


图324DBA基本原理


ONU如果有上行信息发送,会向OLT发送报告申请带宽,OLT内部DBA模块不断收集DBA报告信息进行计算,并将计算结果以带宽映射表的形式下发给各ONU。各ONU根据OLT下发的带宽映射表信息在各自的时隙内发送上行突发数据,占用上行带宽。这样就能保证每个ONU可以根据实际的发送数据流量动态调整上行带宽,提升了上行带宽的利用率。
DBA对PON的拥塞进行实时监控,OLT根据拥塞和当前带宽利用情况及配置情况进行动态的带宽调整。DBA可以带来以下好处。
(1) 可以提高PON端口的上行线路带宽利用率。
(2) 可以在PON端口上增加更多的用户。用户可以享受到更高带宽的服务,特别适用于对带宽突变比较大的业务。
4. PON线路保护技术
PON线路侧的保护技术包括Type B和Type C保护,同时按照业务是否归属于同一台OLT,还可以划分为单归属方案和双归属方案。
1) Type B保护
PON线路的Type B保护是一种针对主干光纤的保护,其保护组网如图325所示。


图325PON的Type B保护


(1) Type B单归属保护组网。
指的是分光器采用一个2∶n的分光器,分别接到同一台OLT的2个PON口上,保护ODN网络中的主干光纤。此时ONU只提供一个PON上行接口。在正常工作的时候,OLT的主用PON口正常工作,备份PON口处以备份状态,可以接收数据,但是不发送数据,如果OLT主用PON口或者主用PON所连接的主干光纤出现故障时,OLT会触发Type B倒换,将业务从主用PON口倒换到备用PON口上。
(2) Type B双归属保护组网。
指的是分光器采用一个2∶n的分光器,分别接到2台OLT的2个PON口上,2台OLT之间进行动态数据同步,ONU只提供一个PON上行接口。此方法除了保护ODN的主干光纤之外,还对OLT整台设备进行保护。正常工作时,主用OLT的PON口工作,备用OLT的PON口处于备份状态。当主用主干光纤或者主用OLT出现故障时,OLT会触发Type B倒换,将业务切换到备用OLT的PON口。
2) Type C保护
PON线路的Type B保护只能保护ODN中的主干光纤,无法保护分支光纤。对于一些非常重要的业务,运营商希望能对分支光纤也进行保护,Type C保护可以满足运营商的这个需求,Type C保护可以保护主干光纤和分支光纤。PON线路的Type C保护组网如图326所示。


图326PON的Type C保护


(1) Type C单归属保护组网。
ONU提供2个上行的PON接口,分别接到2个不同的分光器上,2个不同的分光器分别接到一台OLT的2个不同的PON接口。正常工作时,ONU的主用PON端口处于工作状态,备用上行PON端口处于备份状态,备用口也可以收发数据。当主用ODN出现故障时,ONU触发Type C倒换,从主用的上行PON接口倒换到备用的上行PON接口,PON接口所连接的ODN网络也相应发生倒换,OLT上的PON端口也会跟随倒换。
(2) Type C双归属保护组网。
指的是ONU提供2个上行的PON接口,分别接到2个不同的分光器上,2个不同的分光器分别接到2台OLT的不同PON接口。正常工作时,ONU的主用上行PON端口处于工作状态,备用上行PON端口处于备份状态,当主用ODN出现故障时,ONU触发Type C倒换,从主用的上行PON接口倒换到备用的上行PON接口,PON接口所连接的ODN网络也相应发生倒换,上面的OLT也会跟随倒换。
5. 长发光ONU检测技术
PON上行方向采用时分复用方式,ONU必须按照OLT分配的时隙向上行方向发送数据才能保证数据依次上行到OLT设备而不产生冲突。不按照分配的时间戳向上行方向发送光信号的ONU叫流氓ONU。流氓ONU可以分为以下几种。
(1) 长发光流氓ONU: 任意时刻都在发光的ONU。
(2) 有规律发光流氓ONU: ONU有固定规律地影响特定ONU,如占用了其他固定ONU的时隙。
(3) 随机发光流氓ONU: 无规律地随机发光,可能是提前、延迟等情况。
在当前的技术手段下,仅能有效检测和隔离长发光流氓ONU。因此本书只针对长发光流氓ONU描述。长发光流氓ONU示意如图327所示。
如果该ONU已上线,会导致同一PON口下其他某个ONU或者所有ONU下线或者频繁上下线。如果该ONU未配置,会导致PON口下其他未配置的ONU不能被正常自动发现。


图327长发光流氓ONU示意图


针对长发光流氓ONU的处理一般分为三个过程: 检测、排查、隔离。
(1) 检测(Check): 检测就是定时对PON口进行测试,检查是否存在流氓ONU。检测过程只能判断PON端口下存在长发光流氓ONU,不能定位具体的ONU。OLT在PON上行方向开空窗,即在一段时间内,让所有在线的ONU停止发送上行光信号,此时进行ONU上行光信号的检测,如果检测到上行还有收光,则进入长发光ONU排查流程。
(2) 排查(Detect): 排查过程就是确定具体哪个ONU是流氓ONU的过程。OLT下发指令逐个打开ONU光模块的上行发光,检测是否有上行光信号,并判断当打开某个ONU后是否会导致其他ONU下线,如果某个ONU打开后导致其他的ONU均下线,就说明该ONU为长发光ONU。长发光ONU的检测流程将对该PON口上的所有ONU均检测一遍,确保将所有长发光ONU均检测出来。
(3) 隔离(Isolate): 隔离就是对ONU下发指令,关闭ONU光模块的发送电源,消除流氓ONU对PON口下其他ONU的影响。一旦ONU光模块上行发光被OLT关断后,这个关断将是永久性的,即ONU复位或掉电重启其光模块的上行发光也是被关断的,除非OLT下发命令重新打开,该机制保障了长发光ONU被彻底隔离。
6. ONU节能技术
当ONU在空闲时段即某一时间段内流量均不超过特定门限时,若ONU光模块仍然处于工作状态,则存在着能耗浪费。此时,OLT可通过周期性地关断ONU光模块接收和发送通道,来降低ONU设备功耗,达到节能的目的。节能支持打盹模式和周期性睡眠模式,遵循ITUT G987.3和G.984.3协议。ONU节能推荐在FTTH场景下使用。
1) Doze(打盹)模式
ONU进入Doze模式后,OLT对ONU光模块发送通道进行关断,ONU只能接收来自OLT的下行数据,不向OLT发送上行数据。
(1) 若ONU本地有上行流量等待发送,ONU可以通过本地事件打断关断状态,让ONU光模块的发送通道从关断状态恢复到正常状态。
(2) 若OLT试图让ONU退出该状态(如OLT需要升级ONU版本),OLT可以发送事件唤醒ONU,让ONU光模块的发送通道由关断状态恢复到正常状态。
2) Cyclic Sleep(周期性睡眠)模式
ONT进入Cyclic Sleep模式后,OLT对ONU光模块发送和接收通道进行关断,ONU既不接收来自OLT的下行数据,也不向OLT发送上行数据。
(1) 若ONU本地有上行流量等待发送,ONU可以通过本地事件打断关断状态,让ONU光模块的发送通道从关断状态恢复到正常状态。
(2) 若OLT试图让ONU退出关断状态,必须等到ONU睡眠定时器超期进入到短暂的唤醒状态时,OLT发送的唤醒事件才能够得到响应,让ONU光模块的发送通道由关断状态恢复到正常状态。
7. PON FEC技术
在工程实践中并不存在理想的数字信道,数字信号在各种媒质的传输过程中就会产生误码和抖动,从而导致线路的传输质量下降。
为解决此问题,需要引入纠错机制。实用的纠错码是靠牺牲带宽效率来换取可靠性,同时也增加了通信设备的复杂度。纠错技术是一种差错控制技术,按照应用场景和侧重点不同,可以分为以下两类。
(1) 检错码: 重在发现误码,如奇偶监督编码。
(2) 纠错码: 要求能自动纠正差错,如BCH码、RS码、汉明码。
二者没有本质区别,只是应用场合不同而侧重的性能参数不同。前向纠错(Forward Error Correction,FEC)属于后者。
FEC是一种数据编码的技术,数据的接收方可以根据编码检查传输过程中的误码。前向是指纠错过程是单方向的,不存在差错的信息反馈。
通过在发射端对信号进行一定的冗余编码,并在接收端根据纠错码对数据进行差错检测,如发现差错,由接收方进行纠正。常见的FEC技术有汉明码、RS编码以及卷积码等。FEC原理如图328所示。


图328FEC原理图


不同PON系统物理层采用的FEC技术如表31所示。


表31不同PON系统物理层采用的FEC技术



项目GPON10G GPON50G PONEPON10G EPON

FEC算法RS(255,239)XGSPON和XGPON 下行、XGSPON 上行: RS(248,216),XGPON上行:  RS (248, 232) 下行: LDPC(17280,14592),上行12.4416Gb/s和
24.8832Gb/s: 默认
LDPC(17280,14592),上行49.7664Gb/s: 待定RS(255,239)10G上下行: RS(255, 223),1G上行: RS(255,239)

纠前误
码率BER=1E-4XGSPON和XGPON 下行、XGSPON上行:  BER=1E-3

XGPON上行: BER=1E-4BER=1E-2BER=1E-41G上行:  
BER=1E-4

10G上下行: BER=1E-3

纠后误
码率BER=1E-10BER=1E-12BER=1E-12BER=1E-12BER=1E-12

FEC开关FEC可选开或关下行FEC默认开,上行FEC由OLT动态控制开或关下行FEC强制开,上行FEC默认开,可协商关闭FEC可选开或关下行FEC默认开,上行FEC由OLT动态控制开或关

3.2.3PON技术演进
1. GPON到10G GPON的演进
GPON演进到10G GPON,有以下两种不同的演进方式。
(1) 采用XG(S)PON Combo模式,如图329所示,同一块OLT单板上同时支持XG(S)PON功能和GPON功能,XG(S)PON和GPON的合波功能内置于XG(S)PON Combo光模块中,对外体现为一个XG(S)PON Combo端口和一个XG(S)PON Combo光模块可以同时支持XG(S)PON和GPON功能。当现网的GPON升级为XG(S)PON的时候,需要将现网的GPON单板(包含GPON光模块)更换为XG(S)PON Combo单板(包含XG(S)PON光模块),ONU种类可按需部署,支持GPON ONU、XGPON ONU和XGSPON ONU在同一个ODN下共存。


图329GPON演进到XG(S)PON Combo


采用XG(S)PON Combo模式,OLT侧可以一步到位,ONU侧可以针对用户按需部署,该模式可用于主流运营商的新建场景和现网GPON升级场景。
① 在新建场景: 可以直接采用XG(S)PON Combo单板进行新建,如果用户需要高带宽的高清晰视频业务,可采用XG(S)PON ONU。如果用户是普通的上网业务,可以布放较便宜的GPON ONU以节约成本。
② 在现网GPON升级场景: OLT侧一步到位将原来部署的GPON单板直接更改为XG(S)PON Combo单板,支持XG(S)PON Combo接入的能力。成本占比更大的ONU则可以根据客户套餐的提升而逐渐部署,如果客户还沿用原来的业务套餐,可继续使用以前的GPON ONU; 如果客户需要更高的业务带宽,可将原来的GPON ONU更换为XG(S)PON ONU。

(2) 采用外置WDM1r模式,XG(S)PON Combo需要把原来现网的GPON单板替换掉,会更改现网GPON的业务数据,导致用户的业务会出现短暂的中断,所以也有些运营商准备采用外置WDM1r的演进方式。如图330所示,在外置WDM1r模式中,原来的GPON OLT及配置数据都不需要变更,只需要在局端增加一个WDM1r合分波器。如果有用户需要申请更高的业务套餐,新建XG(S)PON OLT,将新建的XG(S)PON端口光纤连接到WDM1r端口,即可升级支持XG(S)PON。


图330采用外置WDM1r模式支持XG(S)PON


如果运营商早期部署GPON的时候,已经部署了WDM1r,采用这种模式演进就会非常平滑,原来的GPON单板和GPON的配置数据不需要修改和变更,新增XG(S)PON不会引起对业务中断,只需新增XG(S)PON ONU,配置XG(S)PON的数据即可。
如果运营商早期部署GPON的时候,没有部署WDM1r,也可以采用外置WDM1r的方式升级支持XG(S)PON,通过在OLT外置一个WDM1r合波器,实现XG(S)PON和GPON在同一个ODN下共存。但是这种改造模式需要额外的空间放置外置的WDM1r模块,而且原来GPON建设的时候也需要考虑光功率预算的余量(外置WDM1r会引入额外的1.5dB左右衰减)。
2. GPON/10G GPON到50G PON的演进
原有的GPON或者10G GPON网络演进到50G PON网络,使用波分共存的方式进行演进。
(1) 如果原有网络为GPON模式,采用50G PON Combo模式,同一块OLT单板上同时支持50G PON功能和GPON功能,50G PON和GPON的合波功能内置于50G PON Combo光模块中,对外体现为一个50G PON Combo端口和一个50G PON Combo光模块可以同时支持50G PON和GPON功能。当现网的GPON升级为50G PON的时候,需要将现网的GPON单板(包含GPON光模块)更换为50G PON Combo单板(包含50G PON光模块),ONU种类可需部署,支持GPON ONU、50G PON ONU在同一个ODN下共存,如图331所示。


图331GPON演进到50G PON


(2) 如果原有网络为10G GPON模式,采用50G PON Combo模式,同一块OLT单板上同时支持50G PON功能和10G GPON功能,50G PON和10G GPON的合波功能内置于50G PON Combo光模块中,对外体现为一个50G PON Combo端口和一个50G PON Combo光模块可以同时支持50G PON和10G GPON功能。当现网的10G GPON升级为50G PON的时候,需要将现网的10G GPON单板(包含10G GPON光模块)更换为50G PON Combo单板(包含50G PON光模块),ONU种类可需部署,支持XGPON ONU、XGSPON ONU和50G PON ONU在同一个ODN下共存,如图332所示。


图33210G GPON演进到50G PON


3. EPON到10G EPON的演进
EPON演进到10G EPON,OLT侧需要将EPON OLT更换为10G EPON OLT,ONU侧按需部署ONU,EPON ONU和10G EPON ONU可同时在同一个ODN下共存,如图333所示。


图333EPON演进到10G EPON


3.2.4PON技术标准
PON标准制式主要分为两个大类,分别对应ITUT和IEEE两个标准组织,ITUT和IEEE分别定义了一套PON的标准并进行演进。
如图334所示,ITUT和IEEE两个标准组织之间,存在着一定的协同,例如在PON的物理层上尽量共用波长和速率等,共享PON产业链。


图334PON的标准制式及演进


ITUT制定的GPON、10G GPON等标准和技术,是业界的主流PON技术。当前业界使用的绝大部分PON接入都是基于ITUT标准体系制定的GPON、10G GPON标准和技术。
1. GPON序列技术标准
ITUT定义的GPON序列标准如下。
(1) ITUT G.984.1Gigabitcapable Passive Optical Networks (GPON):  General Characteristics,主要讲述GPON技术的基本特性和主要的保护方式。
(2) ITUT G.984.2Gigabitcapable Passive Optical Networks (GPON):  Physical Media Dependent (PMD) Layer Specification,主要讲述GPON的物理层参数,如光模块的各种物理参数,包括发送光功率、接收灵敏度、过载光功率等。同时定义了不同等级的光功率预算。
(3) ITUT G.984.3Gigabitcapable Passive Optical Networks (GPON):  Transmission Convergence Layer Specification,主要讲述GPON的传输汇聚(Transmission Convengence,TC)层协议,包括上下行的帧结构及GPON的工作原理。
(4) ITUT G.984.4Gigabitcapable Passive Optical Networks (GPON):  ONT Management and Control Interface Specification,主要讲述GPON ONT的管理维护协议。
(5) ITUT G.984.5Gigabitcapable Passive Optical Networks (GPON):  Enhancement Band,主要讲述通过波分复用方式为未来业务信号预留的波长范围。
(6) ITUT G.984.6Gigabitcapable Passive Optical Networks (GPON):  Reach Extension, 主要讲述GPON通过中继、光放大器等技术来实现PON长距离传输的架构和接口参数,最大可达60km距离。
(7) ITUT G.984.7Gigabitcapable Passive Optical Networks (GPON):  Long Reach,主要讲述GPON长距离最大60km距离和差分40km距离的规格。
(8) ITUT G.988ONU Management and Control Interface (OMCI) Specification,主要讲述OMCI管理协议,用来管理GPON系列ONT。
ITUT定义的10G GPON序列标准如下。
(1) ITUT G.987.110Gigabitcapable Passive Optical Networks (XGPON):  General Requirements,主要讲述非对称的10G GPON技术的基本要求。
(2) ITUT G.987.210Gigabitcapable Passive Optical Networks (XGPON):  Physical Media Dependent (PMD) Layer Specification,主要讲述非对称10G GPON的物理层参数,如光模块的各种物理参数,包括发送光功率、接收灵敏度、过载光功率等。同时定义了不同等级的光功率预算。
(3) ITUT G.987.310Gigabitcapable Passive Optical Networks (XGPON):  Transmission Convergence Layer (TC) Specification,主要讲述非对称10G GPON的TC层协议,包括上下行的帧结构及工作原理。
(4) ITUT G.987.410Gigabitcapable Passive Optical Networks (XGPON):  Reach Extension, 主要讲述10G GPON通过中继、光放大器等技术来实现PON长距离传输的架构和接口参数,最大可达60km距离。
(5) ITUT G.9807.110Gigabitcapable Symmetric Passive Optical Network (XGSPON),主要讲述对称的10G GPON技术的要求。
ITUT定义的40G GPON序列标准如下。
(1) ITUT G.989.140Gigabitcapable Passive Optical Networks (NGPON2):  General Requirements,主要讲述40G GPON技术的要求。
(2) ITUT G.989.240Gigabitcapable Passive Optical Networks 2 (NGPON2):  Physical Media Dependent (PMD) Layer Specification,主要讲述40G GPON的物理层参数,如光模块的各种物理参数,包括发送光功率、接收灵敏度、过载光功率等。
(3) ITUT G.989.340Gigabitcapable Passive Optical Networks (NGPON2):  Transmission Convergence Layer Specification, 主要讲述40G GPON的TC层协议,包括上下行的帧结构及工作原理。
ITUT定义的50G PON序列标准如下。
(1) ITUT G.9804.1  Higher Speed Passive Optical NetworksRequirements,主要讲述更高速PON(50G PON)的需求,包括更高速的单通道时分复用PON、更高速的多通道时分复用PON以及更高速的点对点PON。
(2) ITUT G.9804.2  Higher Speed Passive Optical Networks:Common Transmission Convergence Layer Specification,主要讲述更高速PON(50G PON)的传输汇聚层的规格,包括上下行的帧结构及工作原理。
(3) ITUT G.9804.3  50Gigabitcapable Passive Optical Networks (50GPON): Physical Media Dependent (PMD) Layer Specification,主要讲述50G PON的物理层参数,如光模块的各种物理参数,包括发送光功率、接收灵敏度、过载光功率等。
2. EPON序列技术标准
IEEE定义的EPON序列标准如下。
(1) IEEE 802.32008 Carrier Sense Multiple Access with Collision Detection (CSMA/CD) Access Method and Physical Layer Specifications Part3,主要讲述EPON的物理层和链路层要求。
(2) IEEE 1903.12013 IEEE Standard for Service Interoperability in Ethernet Passive Optical Networks (SIEPON), 主要讲述EPON和10G EPON的业务层的互通规范,包括包A、包B和包C三种规格。
IEEE定义的10G EPON序列标准如下。
IEEE 802.3av: Physical Layer Specifications and Management Parameters for 10Gb/s Passive Optical Networks,主要讲述10G EPON的物理层和链路层规格。


3.3低时延PON技术


近年来,随着各种互联网新兴业务的崛起以及PON系统的行业应用场景延伸,PON系统的带宽需求会进一步增加,业界需要考虑下一代PON的方案选择。在中国运营商及设备商的共同努力下,ITUT SG15 Q2于2018年2月正式启动50G单波长PON标准立项。选择50G TDM PON(单通道50G PON)作为10G EPON以及XG(S)PON的下一代PON技术,面向2025年左右部署已成为业界共识。在50G PON系统标准的制定和讨论中,由于新业务及新场景的需求,除了带宽以外,也需要考虑低时延的特性。因此,在50G PON标准的制定和讨论中,多个低时延相关的技术方案都被提出并落实相关标准。
(1) 单帧多突发方案。
(2) 独立注册通道方案。
这些低时延PON技术不仅可以应用在50G PON,也可以应用在当前的10G PON上,通过这些低时延的技术方案的引入,PON系统的最大时延可由原来的毫秒量级降至200μs甚至更低。
3.3.1单帧多突发技术
在TDM PON系统中,上行采用TDMA的复用机制。OLT负责分配及调度ONU的上行发送时隙,ONU只能在OLT分配的时隙之内发送上行数据。由于PON系统是点到多点的物理拓扑连接方式,OLT的接收时隙需要合理地分配给所有的ONU。对于某个特定的ONU,其上行时隙窗口是有限的,某一个上行时隙结束至下一个时隙开始的期间,是属于其他ONU的发送时隙,该特定ONU是不能发送任何上行数据的,在此期间需要发送的数据将在ONU本地缓存,等待下一个时隙到来再发送。因此,上行时隙间隔对于ONU的上行时延有较大的影响。
在ITU体系的TDM PON系统中,ONU的上行时隙分配报文位于每个下行帧帧头固定开销的BWmap中,每个BWmap可以完成该下行帧所对应的125μs上行时隙分配。每帧ONU所得到的突发时隙个数与上行数据最大时延的对应关系如图335所示。当每125μs的帧中,ONU1只有1个上行发送时隙时,其发送间隔可以达125μs,最大上行时延也是125μs; 当每125μs的帧中,ONU1有4个上行发送时隙时,那各个时隙之间的间隔是125/4=31.25μs,上行时延可以缩减到原来的1/4。


图335单帧多突发技术原理图


3.3.2独立注册通道技术
TDM PON系统中引入时延和抖动的另外一个因素是新ONU的注册和测距过程,为了保证能够允许新ONU的接入,OLT会定期开启静默窗口,在此期间,已上线的ONU不允许发送上行数据,只有未注册的ONU才允许发送注册请求消息。由于典型PON系统允许的ONU距离需要覆盖0~20km,因此在光纤上传输的往返时延差达到200μs。因此,在ONU注册阶段,静默窗口大小通常是250μs,其中200μs为不同ONU到达OLT的往返时延差,2μs是不同ONU的响应时间差,剩余48μs为ONU在收到授权开窗时额外做的随机时延,用于降低距离相近的ONU在上行注册时的冲突概率。除了注册外,当ONU需要测距时,OLT也需要利用上行静默窗口来完成。
由于注册/测距窗口是不允许正常ONU发送上行数据的,而如果此时ONU有上行业务需要发送,只能等待静默窗口结束再发送,因此,PON系统的注册/测距窗口会引入额外的时延,通常情况下,该时延为250μs。
为了避免注册/测距开窗引入的额外时延和抖动,一种有效的方法就是引入额外的一个波长通道。OLT和ONU都具备2个上行通道,其中一个上行通道用于正常的业务和管理; 另一个通道用于注册/测距,同时,该注册/测距通道也可以用于发送上行业务。
一种典型的利用独立注册通道的PON系统如图336所示。在该系统中有2个上行波长通道和1个下行波长通道,上行和下行分别采用不同的波长,通过波分复用共用同一个ODN网络。ONU的激活响应报文的发送、ONU激活上线之后的用户数据发送,可根据业务需求灵活配置对应到哪个通道,如第一上行通道配置成激活+用户数据发送(此时,该通道为时延较大的上行通道,主要用于传输时延不敏感的用户数据或业务),第二上行通道配置成只进行用户数据收发(该上行通道为低时延的上行通道,用于传输时延敏感的用户数据或业务),或者反之,第一上行通道配置成只进行用户数据收发,第二上行通道配置成激活+用户数据发送。在某些特定应用场景下,为了实现两个上行发射通道间的负荷均衡,OLT的两个DBA调度模块之间需要进行相应的信息互通,以使上行带宽调度更有效率。两个上行通道的上行带宽授权,可由同一个下行通道中的BWmap来完成分配。


图336独立注册通道示意图


可以看到,在TDM PON系统中通过引入额外的注册/测距通道,可以完全消除正常业务通道因注册/测距窗口引入的额外时延和抖动。


3.4OLT设备切片


当前主流OLT基于分组交换内核,并从集中式转发架构演进到分布式转发架构。基于该转发架构的时延模型如图337所示(集中式转发架构时延构成类似)。


图337分组交换架构


分组交换架构报文转发需要实现路由查找、报文编辑、QoS处理等环节。在报文转发的过程中,转发资源(二层查找表、三层查找表、队列资源等)需要通过共享来实现系统的可扩展性并降低实现成本,因此,报文转发在分组架构中无法实现完全隔离。
在分组交换架构下,通过对QoS机制的优化、队列挂接拓扑重组等技术手段,可以实现OLT软切片。
为了达到更好的隔离效果,双平面交换架构成为技术首选方向: 系统交换网同时支持分组交换和TDM交换,分组交换平面兼容了原系统业务处理能力; TDM交换平面解决了转发硬隔离的需求,并降低了转发时延。双平面交换架构如图338所示。


图338双平面交换架构


双平面交换架构的引入,为切片场景提供了更好的解决方案: 报文在PON MAC重组以后,可路由到TDM交叉模块,通过TDM交换平面,实现转发物理硬隔离的低时延硬切片方案,如图339所示。








图339双平面交换架构切片实现方案



3.5网络自动化技术


接入网具有“海量网元、海量连接、海量场景”三大特征。要实现自动化的设计目标,接入网需引入SDN、元数据驱动和NETCONF/YANG等关键技术。
3.5.1SDN
1. 什么是SDN?
不同行业、不同组织因其应用场景、目标和实施方法的不同,对SDN的理解也千差万别。现在业界普遍接受的看法是SDN定义可归为以下三类。
(1) 狭义SDN: 等同于Openflow。
(2) 广义SDN: 控制与转发分离。
(3) 超广义SDN: 管理与控制分离。
由于SDN对于传统分布式网络的颠覆,业界普遍认为未来的SDN应具有三大基本特征,使其可以克服现有分布式网络架构在扩展性、管理性、灵活性等方面的不足,加速整个网络的更新升级,推动整个行业快速前行,如图340所示,SDN应具有如下三大基本特征。
(1) 转控分离,将原有转发、控制一体的形式一分为二,抽象网络底层转发设备、屏蔽复杂度,而上层控制实现高效配置和管理。
(2) 集中控制,将所有设备的控制功能都集中起来,具有更好的全局观,便于资源统一调度。
(3) 开放接口,通过标准接口,实现开放App应用以及通过软件可编程,便于快速引入新业务。


图340SDN组网示意图


SDN的本质定义就是软件定义网络,也就是说希望应用软件可以参与对网络的控制管理,满足上层业务需求,通过自动化业务部署简化网络运维,这是SDN的核心诉求。换言之,控制与转发分离只是为了满足SDN的核心诉求的一种手段。
综上所述,在电信领域SDN是对现有网络架构的一次重构,使得未来网络业务仅仅通过SDN控制器的编程、增加和升级控制器上的软件程序就可以完成新业务部署,快速满足客户灵活多变的需求。
2. SDN优势
SDN相对于传统网络具有以下优势。
(1) 将网络协议集中处理,有利于提高复杂协议的运算效率和收敛速度,可以实现路径的实时选择。
(2) 控制的集中化有利于从更宏观的角度调配传输带宽等网络资源,提高资源的利用效率。
(3) 集中的管理控制面降低了设备安装和维护的工作量。
(4) 虚拟切片,依赖于SDN的可编程性和适当的Underlay运输层技术,可以在一个物理网络上实现多个虚拟网络。
(5) 控制策略软件化,是网络自动化的基础。
3.5.2元数据驱动
元数据业界通用的定义为: 描述数据的数据,用于承载关于数据的组织、数据域及其关系等的信息。在模型驱动架构(Model Driven Architecture,MDA)中的元数据特指用来描述软件应用的配置文件和脚本。应用开发者通过将系统的可变部分抽象并定义为元数据的行为,构造一个基于元数据驱动开发的系统。
MDA元数据关键特征如下。
(1) 端到端: 包括应用的数据和数据结构、界面、服务、业务逻辑、权限、远程调用API等各种配置数据。
(2) 可控性: 通过对配置文件的配置及脚本的开发更改可控制应用程序的界面呈现、业务逻辑走向及数据存储等。
MDA基于用途的元数据分类,如图341所示。


图341元数据的分类


(1) 组件类: 提供应用、组件以及基于组件的插件的元数据类型能力支持,对于定制插件的方式支持定制和定制分离。
(2) 界面类: 提供从站点、主题、页面流、页面、页面组件及页面资源的元数据类型定义,支持拖拽式开发页面。
(3) 编排类: 支持多个应用或组件间的服务编排能力,通过编排提供新的业务能力,支持微流程、人工流、决策流等多种编排方式。
(4) 接口类: 提供服务和事件项结合的方式,组件只能通过服务和事件对外暴露能力。
(5) 逻辑类: 支持脚本、XML、代码等多种业务逻辑实现方式,同时提供业务规则、上下文等处理能力。
(6) 数据类: 提供基于ER关系图整套数据的定义能力,同时支持和搜索引擎的打通,支持数据缓存加速等能力。
(7) 模板类: 提供从组件、界面、编排、逻辑、数据等各个层次的模板能力,加速业务开发。
(8) DFX类: 支持以配置化的方式实现匿名化、校验规则、操作日志、服务性能统计等能力。
(9) 切面类: 提供各个层次的元数据Trigger能力,对元数据扩展支持Extend和Override两种模式。
(10) 权限类: 支持对定制能力进行权限约束,限制哪些可以定制,同时支持对数据权限进行定义。
(11) 环境类: 对元数据引擎运行环境进行统一配置,简化使用。
在一个基于元数据定义的软件系统中,所有的软件相关的活动都由元数据驱动来完成。元数据驱动开发的基本思想就是基于元数据对象声明式开发整个应用,围绕元数据对象创建界面、业务流程、领域服务、领域对象及物理存储表结构等,围绕元数据对象进行测试(包括测试数据生成、用例管理等),围绕元数据对象进行个性化需求定制(包括界面、流程、服务、表结构等),从而通过元数据对象来驱动整个应用开发过程的进行。
MDA元数据驱动开发的优势与特点如下。
(1) MDA提供元数据驱动开发模式,帮助用户快速地完成定制开发,用户界面(User Interface,UI)配置化、向导式定制开发,用户无须掌握太多复杂的编程语言能力。
(2) 遵循敏捷模式与快速交付,屏蔽底层技术,降低应用开发者技术入门门槛,提升软件开发效率和协同工作的能力。
(3) AI人工智能集成,智能复用已存经验,进一步为应用开发者提高生产力,从而提升整体开发效率。
(4) 支持业务应用多租户、多环境、多语言等基本能力。
(5) 提供核心功能元数据引擎,为多种元数据类型提供平台核心引擎解释能力,从而满足业务应用多场景需求。
3.5.3NETCONF/YANG
网络配置(Network Configuration,NETCONF)协议提供一套管理网络设备的机制,用户可以使用这套机制增加、修改、删除网络设备的配置,获取网络设备的配置和状态信息。通过NETCONF协议,网络设备可以提供一组完备规范的API。应用程序可以直接使用这些API,向网络设备下发和获取配置。
NETCONF协议模块是自动化配置系统的基础模块。可扩展标记语言(eXtensible Markup Language,XML)是NETCONF协议通信交互的通用语言,为层次化的数据内容提供了灵活而完备的编码机制。NETCONF可以与基于XML的数据转换技术结合使用。例如XSLT,提供一个自动生成部分或全部配置数据的工具,这个工具可以从一个或多个数据库中查询各种配置相关数据,并根据不同应用场景的需要,使用可扩展样式表语言转换(Extensible Stylesheet Language Transformation,XSLT)脚本把这些数据转换为指定的配置数据格式。然后通过NETCONF协议把这些配置数据上传给设备执行。
NETCONF协议Client和Server之间使用RPC机制进行通信交互。Client必须与Server成功建立一个安全的、面向链接的会话,才能进行交互。
NETCONF协议在概念上可以划分为4层,如图342所示。


图342NETCONF协议框架


(1) 传输协议(Transport Protocol)层为NETCONF Client与Server之间交互提供通信路径。NETCONF可以使用任何符合基本要求的传输层协议承载。
(2) 远程程序呼叫(Remote Program Call,RPC)层提供一种简单的、不依赖于传输协议层的、生成RPC请求和回应消息框架的机制。Client把RPC请求内容封装在一个<rpc>元素内,发送给Server; Server把请求处理结果封装在一个<rpcreply>元素内,回应给Client。
(3) Operations(协议操作)层定义一组基本的操作,作为RPC的调用方法,可以使用XML编码的参数调用这些方法。
(4) Content(管理对象)层定义配置数据模型,数据模型定义依赖NETCONF的实现情况。
YANG是IETF在RFC 6020 中定义的用于网络配置的数据模型描述语言,以支持NETCONF接口协议,实现网络配置的标准化。YANG 语言把数据组织成层次化的树形结构,层次化的数据可以被NETCONF操作(配置、状态数据、RPCs与通知),并可完备表达NETCONF Client与Server之间的数据,如图343所示。


图343YANG示例


(1) 整个树形结构由Node组成,每一个节点有一个名字,并有一个值(Leaf)或者有一组子节点。
(2) YANG可以描述加在数据上的约束,可约束外观或者节点的值。
(3) YANG定义了一组内嵌式的类型并提供一种自定义类型的机制。YANG同时可以允许定义可重用的节点组,这些节点组在实例化时可重定义。
(4) YANG模块可以被翻译成对等的XML语法YIN(YANG Independent Notation),允许应用使用XML parser与可扩展样式表语言转换(eXtensible Stylesheet Language Transformation,XSLT)操作模块,而且转换是无损的。
(5) 为了维护可扩展性,YANG保持了对管理信息结构(Structure of Management Information,SMI)的兼容性,也就是SMI描述的简单网络管理协议(Simple Network Management Protocol,SNMP)模块可以转换为YANG模块。
NETCONF/YANG成为业界的发展趋势,越来越多的运营商要求支持设备和网络控制器支持NETCONF协议和标准YANG模型,YANG生态如图344所示。


图344YANG生态


3.5.4分层抽象以及横向集成
接入网由于面对的部署场景多样,导致接入技术多样,同时接入设备的厂家也较多。采用传统的纵向集成的方式,接入设备集成到运营商的OSS中是一项耗时费钱的工程。吸纳SDN的接口API化、标准化、可编程调用的思想,在接入领域引入基于标准模型驱动的管控组件,通过分层抽象屏蔽技术和厂家差异做到横向集成,如图345所示,减少新技术和新设备导入的变动范围,通过南向标准模型的API对接各个厂家的接入设备加速新设备的集成,通过北向提供开放API接口给上层系统直接调用简化OSS集成的难度,最终提升端到端自动化的开发和使用效率。


图345分层抽象以及横向集成


3.5.5原子API编排提供业务级可编程API
管控析层的控制器模块,也叫作网络自动化平台,基于这个平台提供了原子API的编排能力,带来了如下好处。
(1) 对于平台自身提供的业务,可以基于已有资源模型和策略模型通过编排快速地、动态地提供新的业务。
(2) 对于已有北向接口,屏蔽底层网络实现技术的变化,由编排层完成对新设备、新技术或新架构的协同,从而在不变动北向接口及OSS依赖的相关流程情况下,引入新设备、新技术。
(3) 对已有的北向网元级接口进行编排,提供抽象级别更高的业务级API接口,可软件编程驱动,从而降低系统集成和OSS处理流程的复杂度,且在引入新的业务级接口时并不会影响已经部署的业务。
图346是对原子接口进行编排的流程示意图。系统底层现有的原子接口导入设计态环境作为编排的素材。接口设计人员根据运营商的业务要求把原子接口编程到满足要求的流程中形成新的更高层级的业务级接口。新的业务级接口定义文件打包动态导入运营态,呈现在对外的业务接口目录中以供运营商OSS调用。


图346基于平台对原子接口进行编排的流程示意图


例如在特定运营商应用场景下,通过对已有的FTTx业务发放相关的原子接口进行编排可达到如下效果。
(1) OLT注册。
6个原子操作→1个业务接口。
(2) ONT替换。
4个原子操作→1个业务接口。
(3) ONT删除。
3个原子操作→1个业务接口。


3.6管道质量监测技术


管道质量可视关键技术包括TCP/UDP eMDI、随流检测(Insitu Flow Information Telemetry,IFIT)/随流操作、管理和维护(Insitu Operation, Administration and Maintenance,IOAM)等。
3.6.1TCP/UDP eMDI技术
媒体传输质量指标(Media Delivery Index,MDI)和eMDI是通过测量业务报文的传输特征,来提取和计算报文及业务KPI的一种手段。
MDI技术由IETF RFC 4445定义,实现了媒体流传输过程中延时和丢包两个维度的度量。
eMDI技术是MDI技术的增强,由两个RFC草案所定义。
draftdingtcpemdi00定义了基于TCP承载层KPI的度量。在测量过程中引入“测量点”概念,以测量点为基础,可以实现从测量点到用户侧、从测量点到网络侧的度量。测量指标如表32所示。


表32TCP eMDI指标



测量指标指 标 说 明指 标 含 义

UPLRUpstream Packet Lost Ratio从服务器到测量点的丢包率

DPLRDownstream Packet Lost Ratio从测量点到用户终端的丢包率

URTTUpstream Average RTT从服务器到测量点的报文平均往返时间

DRTTDownstream Average RTT从测量点到用户终端的报文平均往返时间

E2ETEnd to End Throughput从用户终端到服务器的吞吐量(包数)

DTDownstream Throughput在测量点观测到的下行每秒吞吐量(包数)

UTUpstream Throughput在测量点观测到的上行每秒吞吐量(包数)

draftzhengemdiudp00定义了基于UDP承载的媒体流的度量。其在RFC4445的基础上,利用前向纠错技术(Forward Error Correction,FEC),引入了有效丢包因子(Effective Loss Factor,ELF)的概念,更好地实现了传输质量的度量。
在现网IPTV业务、VR业务以及视频回传业务中,UDP eMDI技术已经大量应用于提升视频业务的运营能力。
TCP eMDI技术不仅可以用于上层应用中媒体流的时延和丢包的度量,也可以用于文件传输协议(File Transfer Protocol,FTP)下载、超文本传输协议(Hypertext Transfer Protocol,HTTP)、加密的HTTP(HTTP Secure,HTTPs)等应用的传输层KPI的度量。
3.6.2IFIT/IOAM带内探测技术
当前已经有多种业务检测/探测技术在使用。
(1) 二层组网应用中,有ITUT所定义的Y.1731技术,IEEE所定义的802.1AG、802.3AH技术。
(2) 三层组网应用中,有Ping/Traceroute、TWAMP技术等。
这些技术手段有个共同的特点: 业务检测/探测报文由相关功能模块单独发送和接收,和用户实际业务流共用转发路径及业务报文分离,因此称之为带外探测技术。
带外探测技术由于和业务报文相互独立,采集信息和业务报文不严格对应,导致探测结果和实际业务的质量有偏差,因此,无法满足网络智能化精确测量的要求。针对带外探测技术的缺点,业界定义和实现了带内探测技术IFIT/IOAM。
IOAM是Cisco联合Facebook及Mellanox、Marvell、Barefoot等公司于2016年在IETF提交的技术方案,后更名为Insitu OAM。在IOAM Ingress节点,对指定业务流的报文插入IOAM头,包含时间戳、node ID、接口ID、Sequence Number等信息。在IOAM Transit节点,对指定业务流的报文插入当前节点的时间戳(取自网络时钟/时间同步协议,如1588v2等)、 node ID、接口ID。在IOAM Egrss节点,对指定业务流的报文插入当前节点的时间戳、 node ID、接口ID。解封装后,把指定周期内的采集数据上送分析器。在采集分析器节点,对统计周期内的报文进行分析,将发包的序列号和接收端的序列号进行对比,差额就是丢失的报文。IOAM只需要网络首尾节点部署,即可完成测量。
IOAM当前不支持MPLS封装,也不支持逐跳丢包检测,所以应用场景比较受限。
IFIT是在IOAM基础上增强的带内探测技术,由IETF于2021年初步定义(draftsongopsawgifitframework14)。IFIT定义了用户报文携带Telemetry指令头(Telemetry Information Header,TIH),中间节点逐点上报数据。数据输出可以采用UDP封装,转发面直接生成UDP上报报文,直接上送数据前置处理模块。支持端到端测量,中间点不感知; 也可以逐点部署,逐跳检测; 支持多协议标记交换(Multiprotocol Label Switching,MPLS),基于MPLS的段路由(Segment RoutingMPLS,SRMPLS)封装, 第六版因特网协议(Internet Protocol version 6,IPv6)封装,基于IPv6的段路由(Segment RoutingIPv6,SRv6)封装,第四版因特网协议(Internet Protocol version 4,IPv4)封装以及以太网封装。
IFIT满足了逐跳丢包检测的诉求,可以实现质差问题的精确定界。


3.7网络智能化技术


智能化的基础是数据、算法和算力。传统的数据采集技术已经无法满足智能化算法和应用所需要的更为高效实时的数据采集需求,需要引入Telemetry技术。有了大量的数据后,接入网领域的一些依赖人工很难或者无法解决的问题,可以被领域和算法专家抽象为分类、聚类、回归、关联问题,机器学习和AI算法就可以发挥作用来大幅提高效率。特别在一些实时性要求高、算力要求大的场景下,仅靠通用的中央处理单元(Central Processing Unit,CPU)无法提供实时控制所需要的推理反馈,这个时候就需要考虑引入擅长进行AI推理的专用芯片。
3.7.1Telemetry技术
网络传输过程中存在很多的微突发现象,此时如果报文超过设备转发能力将被丢弃,导致通信双方重传报文,进而影响通信质量。微突发流量越多,网络通信质量越差,因此网管需要及时检测到微突发现象,并且快速进行调整。传统数据采集技术如图347所示,不适合现代网络和安全性要求,此时,需要提供快速、高效的网络感知服务,便于及时监控网络的性能状况。


图347传统数据采集技术


传统的网络监控方式多是数据前置处理模块通过拉模式(Pull Mode)来获取监控数据,存在以下很多不足。
(1) 资源消耗大: 拉模式需要数据消费者(管理分析系统)维护采集状态机和定时器,消耗的资源大,无法监控大量网络节点,限制了网络增长。
(2) 数据精度低: 智能运维对网络节点数据精度要求越来越高,传统的网络监控方式只能依靠加大查询频度来提升获取数据的精度,会使得监控操作本身对网络节点产生影响,导致网络节点CPU利用率高而影响设备的正常功能。
(3) 数据实时性差: 由于网络传输时延的存在,监控到的网络节点数据并非实时。
(4) 数据结构化弱: 传统的网络监控传递的数据是非结构化数据(缺乏标准模型定义),智能对接难度大。
Telemetry技术通过高速实时的推模式(Push Mode)来上报数据指标,为网络问题的定位、网络质量优化调整提供最底层最基础也最重要的数据支持。
Telemetry是从传统的SNMP方式(Pull Mode)演进为高性能的下一代网络采样模式(Push Mode),如图348所示,“推模式”基于模型的数据格式上报,提供更高效的传输机制,变化点如下。
(1) 采集方式: 从拉模式到推模式(基于时间和基于事件触发数据订阅,随后数据持续推送)。
(2) 建模: 支持基于YANG模型推送数据。
(3) 传输机制: 从SNMP到更高效率传输机制Google远程过程调用(Google Remote Procedure Call,gRPC)协议。


图348拉模式和推模式对比


SNMP Trap和SYSLOG虽然是推模式的,但是其推送的数据范围有限,仅是告警或者事件,对于类似接口流量等的监控数据不能采集上送。
Telemetry监测提供推模式来监测网络,如表33所示,Telemetry相对传统网络监控方式优势如下。
(1) 提升监测数据的实时性。
(2) 减少网元压力。
(3) 可以支持更大的网络规模。


表33Telemetry与传统网络监控方式的对比



对比项SNMP getSNMP TrapCLISYSLOGTelemetry

工作模式拉模式推模式拉模式推模式推模式

精度分钟级秒级分钟级秒级亚秒级

数据范围所有数据仅有告警所有数据仅有事件所有数据

是否结构化MIB定义结构MIB定义结构非结构化非结构化YANG模型定义结构

1. Telemetry框架
Telemetry是一个网络性能监控技术,包括数据生成、收集、存储和分析系统,Telemetry框架如图349所示。
(1) 针对网元设备: Telemetry=数据模型+编码+传输协议。
(2) 针对网络管理系统: Telemetry=收集+过滤+存储+数据分析系统。


图349Telemetry框架


(3) 数据前置处理模块(Data Collector,采集器)和分析器(Data Analyzer)。
① 数据前置处理模块位于管理系统侧,用于收集、过滤和存储网络设备上报的监控数据。
② 分析器位于管理系统侧,用于分析监控数据。
(4) 网络设备(Data Source)。
按照数据前置处理模块的要求,周期性采样和上报性能数据。
2. Telemetry模型
网络设备上的数据都可以通过模型进行描述,保证网管和设备之间的交互正确实现。所谓模型驱动,是指用户或者网管可以通过指定模型路径的方式来通知设备,需要推送哪些数据,同时设备也要按此模型定义的格式进行数据上报。
如图350所示,Telemetry技术的采样数据源来自设备的转发面、控制面和管理面,数据按照YANG模型描述的结构进行组织,利用谷歌混合语言数据标准(Google Protocol Buffer,GPB)格式编码,并通过gRPC或UDP协议将数据上送至数据前置处理模块和分析器进行分析处理。


图350Telemetry采用模型驱动的数据采集方式


1) YANG模型
YANG是一种数据建模语言,用于为各种传输协议操作进行配置数据模型、运行数据模型、远程调用模型和通知机制等。
2) GPB格式编码
GPB编码格式,是一种与语言和平台无关、扩展性好、用于通信协议、数据存储的序列化结构数据格式。GPB通过“.proto”文件描述编码使用的字典,即数据结构描述。同时可以利用Protoc等工具软件根据“.proto”文件自动生成代码(如Java代码),然后基于自动生成的代码进行二次开发,对GPB进行编码和解码,从而实现设备和数据前置处理模块的对接。
例如,一个中间商描述订单的dealer.order.proto文件描述如下: 


Package dealer

message Order

{

required int32 time=1; // 时间(用整数表示)

required int32 userid=2;   //客户id(用整数表示)




required float price=3;   //单价(浮点数)

required int32 quantity=4 ;   //数量(整数)

optional string desc=5;   //订单描述(字符串)

}

中间商订单分析系统从各个分支机构采集订单数据的逻辑结构如图351所示。


图351数据生产者和消费者使用同一个.proto文件实现对接


GPB格式的兼容性也很好,可以在YANG模型、JSON模型、XML模型下灵活转换。GPB主要包含两种编码格式: 紧凑格式和keyvalue格式,如表34所示,紧凑格式使用数字编号代替了关键字,实现消息的紧凑化; keyvalue格式和JSON模型是一致的。


表34GPB的紧凑格式和keyvalue格式



紧凑格式(数字编号)keyvalue 格式(关键字)

1:  324156

2:  12345678

3:  21.99

4: 30

5: “VIP customer”time:  324156

userid:  12345678

price: 21.99

Quantity: 30

desc: “VIP customer”

在设备和数据前置处理模块之间传输数据时,GPB格式编码的数据比其他格式编码的数据具有更高的信息负载能力,保证了Telemetry业务的数据吞吐能力,同时降低了CPU和带宽的占用率。
3. 数据订阅
Telemetry数据采用订阅和上报的方式,支持静态和动态订阅监测数据。
1) 静态订阅监测数据
(1) 数据前置处理模块通过命令行视图(Commandline Interface,CLI)、NETCONF等接入方式连接到设备之后,创建静态订阅配置,采用openconfig定义的openconfigtelemetry.YANG模型,指定采样哪些数据源,按照什么频率采用哪种通道、格式上传给某个数据前置处理模块。
(2) 设备按照静态订阅的配置,将周期采样数据上传给数据前置处理模块。
(3) 在系统重启或主备倒换时,Telemetry静态订阅的配置会保存; 重启或倒换完成后,Telemetry功能会重新加载配置,采样和上报任务会继续运行。
2) 动态订阅监测数据
(1) 需要在设备上使用gRPC服务。
(2) 数据前置处理模块通过gRPC连接到设备之后,下发订阅请求来获取采样数据。
(3) 下发订阅请求的报文格式按照openconfig定义的openconfigrpc.YANG描述,在报文中指定采样的传感器路径、采样频率、上送的报文格式等。
(4) 设备收到请求后,对指定传感器资源进行采样,在当前的gRPC连接中上报给数据前置处理模块。
(5) 当连接断开时,采样任务结束; 需要数据前置处理模块再次连接,再次订阅。
4. 数据上报
Telemetry数据上报采用gRPC或者UPD传输协议,数据内容采用GPB编码格式。
1) gRPC
gRPC是一个高性能、开源和通用的RPC框架,面向移动和HTTP/2设计,支持多语言版本。
gRPC具有诸如双向流、流控、头部压缩、单TCP连接上的多复用请求等特性。这些特性使其在移动设备上表现更好,更省电,更节省空间。其支持TLS1.2加密通道,是安全可靠的传输方式。
2) UDP
UDP方式因为是无连接的,所以支持采样数据从框式设备的单板甚至是芯片直接上传,采样数据的实时性比gRPC更高。但是UDP承载方式的加密手段只能使用数据报传输层安全(Datagram Transport Layer Security,DTLS)协议,不像传输层安全(Transport Layer Security,TLS)协议那么普遍。
3.7.2机器学习
1. 什么是机器学习
机器学习(Machine Learning)也叫作机器训练,是针对一个特定问题,让机器(计算机)根据历史数据建立一个输入特征和输出结果之间函数关系的过程; 这个函数我们通常叫作模型,而这个函数的输入我们一般叫作特征集,这个特征集标识了哪些数据是这个模型的影响因子。
1) 传统机器学习
传统机器学习有着严格的数据理论支撑,在整个工作流中,特征工程占了工作量的绝大部分: 业务专家根据自己的经验来选择特征集,特征提取质量和数据指标会直接影响建模效果。
2) 表示学习
表示学习也叫作特征学习,严格来讲是整个机器学习流水线(Pipeline)中特征工程的一部分,需要和其他机器学习任务一起构成整个流水线。好的数据表达方式对于后续的特征提取和建模是至关重要的,而这个表达方式的获得依赖“表示学习”。表示学习实际的含义是“学习怎样有效提取特征,怎样有效表达样本数据,学习如何学习”。
3) 深度学习
区别于传统的机器学习,深度学习的最大进步就是让“机器自己在貌似无规律的数据中寻找特征”,而不是像传统机器学习那样需要人工来设置特征集,如图352所示。这一点对于在无规律、非序列化的数据中寻找隐藏的数据关联是至关重要的,所以深度学习在图像识别、语音语义识别领域可以大放异彩。基于神经网络算法的深度学习可以分层迭代,并且可以通过反向传播训练结果来矫正特征集的选择,特征集也会逐层复杂化,可以发现更多的潜在特征。


图352机器学习的进步


深度学习利用多个简单且非线性的模块,组合起来对数据进行变换(Transformation),得到抽象水平逐层递增的数据表达(Representation),利用足够多的这种变换,可以学得极其复杂并且是不可解释的函数。比如汽车图像的识别,输入为由像素值组成的向量,第一层学到的特征多为在特定方位的图像边缘,第二层多为根据边缘生成的花纹(Motifs),第三层可能将这些花纹组合成了车的一部分。深度学习不需要复杂的数学算法支撑,在大数据样本上效果要好过传统机器学习,但是深度学习对计算能力的要求很高,并且学习出来的模型是不可解释的。
2. 机器学习方法
在机器学习领域有四类不同的学习方法,如图353所示。
0
0


图353机器学习四类不同的学习方法


1) 监督学习(Supervised Learning)
样本数据中包含确定的输出结果,让机器对明确的输入数据和输出结果来生成映射函数,数学上可以表达如下。
机器需要学习到函数关系: 
y=f(x)
输入数据集: 
(x1,y1),(x2,y2),…,(xn,yn)
求最优函数: 
arg minf∑ni=1(f(xi)-yi)2
样本数据由输入数据(通常是向量)和预期输出结果组成,预期输出结果可以是一个连续的值(回归分析),或者是一个标签(分类)。监督学习的实质是在学习完一些样本数据后,寻找到一个最优的函数关系,并且假设这个最优函数用在分析未知数据时,获得的输出也是最接近真实的。
对应的回归类算法是线性回归如指数或对数回归; 对应的分类算法是人工神经网络、支持向量机、最近邻算法、朴素贝叶斯方法、决策树和径向基函数分类等。
监督学习的准确性在大样本量时可以做到很高,但难点是需要对样本数据中的预期输出进行标记,而这意味着需要人工来进行结果标记或者要求输出结果是可自动测量的。
2) 半监督学习(Semisupervised Learning)
半监督学习是综合利用有输出结果的样本数据(已标记样本)和没有输出结果的样本数据(未标记样本),来生成合适的分类或者回归函数。其基本思想是利用无监督学习的方法在未标记样本上建模,然后使用标记样本进行模型参数的训练调整。从数学角度可理解为使用未标记样本的输入边缘概率 P(x)和已标记样本的概率P(y|x)分布来建立良好的回归或者分类函数,并假设其对未知的X、Y也是符合的。
对应的经典算法基本上是有监督算法的延伸。
3) 无监督学习(Unsupervised Learning)
无监督学习是样本数据没有包含预期输出结果,要求机器直接对输入数据进行建模,数学上可以表达如下。
机器需要学习到函数表达式: 
h(x)
输入数据表达式: 
x1,x2,…,xn
无监督学习的主要用处是对原始数据进行分类。有别于监督学习网络,无监督学习网络在学习时并不知道其分类结果是否正确,也不知道这个类别意味着什么。其特点是仅仅在输入数据中找出潜在类别规则。学习出来的模型可以去分类新的陌生数据。
无监督学习的典型例子就是聚类。聚类的目的在于把相似的东西聚在一起,机器并不关心这一类是什么。因此,一个聚类算法通常的目的就是计算相似度。
对应的经典算法有聚类算法、混合高斯模型、因子分析等。
4) 强化学习(Reinforcement Learning)
强化学习主要应用在自动驾驶、自适应控制等领域。强化学习系统以一种“试错”的方式进行学习,通过与外部环境进行交互获得的评价来指导行为,目标是使智能体获得最好的评价。强化学习不同于监督学习,系统的动作、环境的信息以及给予的评价信号是一个连续的过程,而且评价信号也不会立即或者明确告诉系统是好还是坏,系统只能以小孩学走路的方式,通过行动—评价—增强或者减弱来获得知识,改进行动方案以适应环境。
对应的经典算法有价值/策略迭代、价值函数逼近、微分动态规划、策略搜索和增强等。
3. 机器学习常见算法
机器学习方法的重要理论基础之一是统计学,按照解决的问题类型可以分为以下几类。
1) 分类方法
分类方法是机器学习领域使用最广泛的技术之一。分类是依据历史数据形成刻画事物特征的类标识,进而预测未来数据的归类情况。分类的目的是使机器学会一个分类函数或分类模型(也称作分类器),并使该模型能把数据集中的事物映射到给定类别中的某一个类。
在分类模型中,我们期望根据一组特征来判断类别,这些特征代表了物体、事件或上下文相关的属性。
最常见的用于分类的算法有决策树、SVM、朴素贝叶斯(Naive Bayesian Model, NBM)、逻辑回归等。
2) 聚类
聚类是将物理或抽象的集合分组成为由类似的对象组成的多个类的过程。由聚类生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。在许多应用中,一个簇中的数据对象可作为一个整体来对待。
在机器学习中,聚类是一种无监督的学习,在事先不知道数据分类的情况下,根据数据之间的相似程度进行划分,目的是使同类别的数据对象之间的差别尽量小,不同类别的数据对象之间的差别尽量大。
常见的聚类算法有基于划分的KMeans、PAM、基于密度的DBSCAN、Meanshift等。

3) 回归分析
回归分析(Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度。回归是根据已有数值(行为)预测未知数值(行为)的过程,与分类模式分析不同,预测分析更侧重于“量化”。一般认为,使用分类方法预测分类标号(或离散值),使用回归方法预测连续或有序值。
常见的预测模型基于输入的用户信息,通过模型的训练学习,找出数据的规律和趋势,以确定未来目标数据的预测值。
常见的回归算法有线性回归、多项式回归等。
4) 关联规则
关联规则是指发现数据中大量项集之间有趣的关联或相关联系。挖掘关联规则的步骤如下。
(1) 找出所有频繁项集,这些项集出现的频繁性至少和预定义的最小支持计数一样。
(2) 由频繁项集产生强关联规则,这些规则必须满足最小支持度和最小置信度。
随着大量数据被不停地收集和存储,许多业界人士对从数据集中挖掘关联规则越来越感兴趣。从大量商务事务记录中发现有趣的关联关系,可以帮助制定许多商务决策。
通过关联分析发现经常出现的事物、行为、现象,挖掘场景(时间、地点、用户性别等)与用户使用业务的关联关系,从而实现因时、因地、因人的个性化推送。
常见的关联算法有Apriori频繁项挖掘、FPGrowth等。
3.7.3AI加速
学习和推理阶段都需要非常大的计算量,特别是基于人工神经网络的深度学习,比拼的就是数据量和计算能力。人工神经网络的主要计算是矩阵的乘加运算,传统通用处理器往往需要数百甚至上千条指令才能完成一个神经元的处理,对于并不需要太多的程序指令,却需要海量数据运算的深度学习的计算需求,这种结构就显得非常笨拙。所以,AI加速芯片应运而生。AI加速芯片的主流架构有以下四种。
(1) 传统通用CPU。
传统的通用CPU虽然矩阵运算性能差,但是强项在于通用、保有量大、生态较好,所以在一些轻计算量的场景下仍然可以用作AI加速。

(2) 图形处理器。
图形处理器(Graphics Processing Unit,GPU)最初是用在个人计算机、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器,可以快速地处理图像上的每一个像素点。后来科学家发现,其海量数据并行运算的能力与深度学习需求不谋而合,因此,被最先引入深度学习,GPU擅长浮点运算的特点得到了充分利用,使其成为可以进行并行处理的通用计算芯片。
(3) 异构化现场可编程门阵列。
将CPU集成到FPGA(Field Programmable Gate Array,FPGA)上。在这种架构中,CPU内核所不擅长的浮点运算以及信号处理等工作,将由FPGA内核执行。FPGA的最大优势在于灵活性,可以方便地修改电路来应对不同场景。
(4) 专用集成电路。
ASIC(ApplicationSpecific Integrated Circuit,ASIC)是为专门目的而设计的、功能特定的最优功耗AI 芯片。不同于GPU 和FPGA 的灵活性,定制化的ASIC一旦制造完成将不能更改,所以初期成本高、开发周期长,进入门槛高。目前,大多是具备AI 算法又擅长芯片研发的巨头参与,如Google公司的张量处理单元(Tensor Processing Unit,TPU)。
另外在云端和设备端,学习和推理所需要的计算能力、计算方法以及功耗成本是有差别的,如表35所示,AI加速芯片在云端学习、云端推理和设备侧推理三条线上会分别发展。


表35云端学习、云端推理和设备侧推理对比



指标云 端 学 习云 端 推 理设 备 推 理

运算方式矩阵乘加运算

激活函数的非线性变换

不能稀疏和剪枝矩阵乘加运算

激活函数的非线性变换

可以稀疏和剪枝矩阵乘加运算

激活函数的非线性变换

需要稀疏和剪枝

低比特量化降低计算量

数据量海量少少

运算量超大中小

成本、功耗不敏感不敏感敏感

建议架构GPU、ASICFPGA、ASICCPU、FPGA、ASIC

应用场景公有云学习公有云推理边缘智能、机器人、智能手机

AI加速芯片可以根据场景要求灵活部署在分析平台、OLT设备或者ONT设备上。图354所示是一种在接入网OLT设备部署AI加速芯片的架构示意图。
由于一些场景的算力需求较大,现有的主控和接口单板在预留处理正常的管理和控制面任务后,已经不能胜任计算要求,需要考虑单独配置一块单板专门用于AI推理等大算力任务。


图354OLT设备部署AI加速芯片示意图