自动驾驶网络 自智时代的网络架构

978-7-115-61570-1
作者: 党文栓
译者:
编辑: 韦毅

图书目录:

详情

本书展现了智能世界中通信网络自动化、智能化的愿景,阐述了华为自动驾驶网络的发展历程、应用场景、基础理论、参考架构及相关的关键技术。本书主要介绍自动驾驶网络的顶层架构、分层架构(包括自智网络引擎、网图、AI Native网元)、关键特征(包括分布式AI、内生安全)等的架构设计,以及网络可信任AI、网络分布式AI、网络数字孪生、网络仿真、网络知识和专家经验数字化、网络人机共生、网元内生智能、网络内生安全等关键技术。本书还介绍了产业组织、标准组织的标准全景和分级评估方法,并以华为自动驾驶网络解决方案为例,阐明如何推行实践。 本书可为通信网络自动化、智能化领域的专业人士,以及科研院所相关领域的研究者提供参考。

图书摘要

自动驾驶网络系列

自动驾驶网络:自智时代的网络架构

主编 党文栓

副主编 黄河 于益俊 张勇

Autonomous Driving Network Network Architecture in the Era of Autonomy

人民邮电出版社

北京

图书在版编目(CIP)数据

自动驾驶网络:自智时代的网络架构/党文栓主编.--北京:人民邮电出版社,2023.7

(自动驾驶网络系列)

ISBN 978-7-115-61570-1

Ⅰ.①自… Ⅱ.①党… Ⅲ.①计算机网络—应用—自动驾驶系统 Ⅳ.①V241.4

中国国家版本馆CIP数据核字(2023)第089739号

◆主编 党文栓

副主编 黄河 于益俊 张勇

责任编辑 韦毅

责任印制 李东 焦志炜

◆人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 https://www.ptpress.com.cn

固安县铭成印刷有限公司印刷

◆开本:720×1000 1/16

印张:23.25  2023年7月第1版

字数:541千字  2023年7月河北第1次印刷

定价:129.00元

读者服务热线:(010)81055552 印装质量热线:(010)81055316

反盗版热线:(010)81055315

广告经营许可证:京东市监广登字20170147号

内容提要

本书展现了智能世界中通信网络自动化、智能化的愿景,阐述了华为自动驾驶网络的发展历程、应用场景、基础理论、参考架构及相关的关键技术。本书主要介绍自动驾驶网络的顶层架构、分层架构(包括自智网络引擎、网图、AI Native网元)、关键特征(包括分布式AI、内生安全)等的架构设计,以及网络可信任AI、网络分布式AI、网络数字孪生、网络仿真、网络知识和专家经验数字化、网络人机共生、网元内生智能、网络内生安全等关键技术。本书还介绍了产业组织、标准组织的标准全景和分级评估方法,并以华为自动驾驶网络解决方案为例,阐明如何推行实践。

本书可为通信网络自动化、智能化领域的专业人士,以及科研院所相关领域的研究者提供参考。

编委会

主  编:党文栓

副 主编:黄 河  于益俊  张 勇

执行主编:黄西华  王云芳

委  员:黄海荣  解 宁  张立岩  饶宝全

司 昕  夏文鑫  鲍 抑  李 斌

刘 鑫  汪超亮  戴玉宏  刘银胜

谢国强  缪丹丹  闫 琦  邓 丹

郝 爽  潘 凌  傅志森  彭国伟

杨 灿  师晨光  成 欣  朱 坤

詹 智  牛 野  沈 恒  唐展图

林文旭  胡丹华  黄执华  邹 兰

郑光迎  曾建国  黄圣钦  李继昂

阴元斌  张厚坤  温瑞勇  鱼桂娟

沙 睿  郭 萍  陈嘉栋  杨 洁

谭成美  李春苗

技术审校:郁 鑫  林永明  施震宇

序一

自智网络作为网络技术和数字技术的交汇节点,是网络未来发展的重要方向之一,将助力网络设备、网管系统协同,提升网络智能化能力,推动赋能服务智能化,促进新型基础设施数字化、自动化、智能化升级,加快网络强国、数字中国建设。

标准是推动产业发展的关键支撑、引领技术创新的重要抓手。中国通信标准化协会作为自智网络的倡议者和推动者之一,2021年起就积极与TM Forum (TeleManagement Forum,电信管理论坛)等产业伙伴合作,共同推进自智网络的标准化工作。中国通信标准化协会已经建立了以TC7为主的标准协调机制——自智网络联席会议,以及以TC610为主的产业推动体系——自智网络工作组,二者协同配合,共同推动自智网络产业与标准的发展。

目前,我国自智网络的发展紧跟全球步伐,进入规模化试点验证和体系化现网部署阶段,形成了多组织协同制定标准、运营商加速规划部署、供应商联合案例创新的发展态势。在技术研发方面,提出了推进网络自动化、智能化的系统性方法;在标准制定方面,中国通信标准化协会完成了20余项行业标准,立项了10个研究课题;在产业推进方面,启动了“自智网络领航者计划”,中国电信运营商提出了“2025年达到自智网络L4级”的战略目标,共建自智网络融合生态。

自智网络作为网络自动化、智能化升级的演进方向,需要多种前沿技术的融合创新、协同发展,与之相关的标准化工作呈现出前沿化、跨界化、国际化等特征,在制定这些标准的过程中更需要注重时效性、协调性、有效性,要符合行业和会员需求。因此,自智网络标准体系的制定,不单单是定义某个单一的技术标准本身,而是一整套完整的体系,包含目标架构、分级标准、评估指标、运营商的运营运维实践等。在标准体系制定过程中,需要产业各方积极参与,在全产业全流程中,充分应用标准,并给予积极反馈,促进标准与实践的紧密结合,充分发挥标准推动科技创新、引领时代进步的技术支撑作用。

华为撰写的《自动驾驶网络:自智时代的网络架构》一书以从自智网络走向L5的技术视角,进行系统化的思考和分享。这些内容对产业的长期演进和发展很有价值。希望各位产业同人可以从书中汲取经验,共同探讨并规划制定与之匹配的标准体系和技术体系,充分发挥标准的创新引领作用,以标准聚集产业各方资源和力量,牵引产业沿着共同的代际进行有序演进和技术升级,共同推进自智网络的繁荣发展。

闻库,中国通信标准化协会理事长

序二

当前,5G等新一代信息技术加速创新突破,算力与网络开启深度融合,新型信息基础设施推进各行各业生产主体、生产对象、生产工具、生产方式的数字化升级再造,驱动全社会的数智化转型。自智网络为数字产业化和产业数字化提供了重要推动力。

作为“自智网络”理念的发起者与实践先行者,中国移动持续夯实网络领先优势,积极推进自智网络体系创新、能力建设与规模应用,赋能社会生产方式的变革,助力千行百业的“智改数转”。通过不懈努力,2022年,中国移动全网自智网络平均水平超过L2.8级,核心运维能力自动化率超过80%,AI运维能力超过170项,日均调用次数超过40亿。

然而,在推动自智网络发展的过程中,我们仍然面临诸多挑战。一方面是缺乏达成普遍共识的业务价值度量体系。如何度量自智网络带来的业务成效,以价值驱动数智化能力提升,一直是业界面临的难题。另一方面是技术创新有待突破。一是算网联合自智,需要基于不同业务场景的算力和流量特征,实时计算“算+网”的最佳路由,实现“算为核心”“以网强算”;二是全栈AI部署,需要协同提升网络和网管的AI能力,实现全栈智能、以智提质;三是数字孪生,需要构建物理网络的虚拟镜像,实现网络全息实时感知和时空镜像,助力智能化决策和高效率创新。

在后信息时代,全球通信产业具有广阔前景与无限可能。加快面向“连接+算力+能力”的网络数智化转型升级,需要产业各方的同心聚力和精诚合作。此次华为将自智网络领域的最新研究进展和成果与业界分享,对自智网络的学术研究、创新实践和标准定义具有重要的参考和借鉴价值。希望业界的合作伙伴协同发力,加快推动自智网络理论创新和技术创新,促进产业繁荣发展,共创数智未来!

李慧镝,中国移动集团公司副总经理

序三

华为自2017年决策开发昇腾人工智能芯片以来,一直在思考人工智能在哪些领域能实现价值。机器视觉、语音语义识别、自动驾驶当然是人工智能实现价值的领域。我也一直在参与自动驾驶的讨论,清楚产业界把汽车的自动驾驶分为L0~L5级,最终实现无人驾驶。华为深耕通信产业30多年,一直在努力帮助电信运营商提升运维效率、减少维护工作量,自然而然想到,如果把人工智能应用于网络,使网络也能实现自动驾驶,那么对运营商将带来颠覆性改变,于是就产生了“自动驾驶网络”的概念,当然这也是电信运营商网络智能化的终极目标。

我们确定努力实现自动驾驶网络的目标后,在公司成立了自动驾驶网络研究项目组,期望通过不断探索来定义自动驾驶网络及攻克所需的关键技术,并期待有开创性的成果。

本书是华为自动驾驶网络研究项目组的一些研究成果,期望能在产业界起到抛砖引玉的作用。

徐直军,华为技术有限公司副董事长、轮值董事长

引言

从1876年亚历山大•格雷厄姆•贝尔发明电话算起,通信网络的发展已经历了近一个半世纪的时间。发展到今天,一方面,通信网络已经深度融入人类社会生活、工作的方方面面,我们每时每刻都在享受着通信网络服务,以及基于通信网络衍生出来的各种互联网应用服务。通信网络除了提供语音通信、网络购物、移动支付、视频直播、在线教育、远程医疗等个人消费类服务,还成为电力、金融、制造、能源、政务、医疗、教育、交通、化工等诸多领域的信息基础设施。通信网络与人类社会的融合程度如此之深,以至于我们几乎感受不到通信网络服务的存在,或许只有在服务出现中断的时候,我们才意识到它的不可或缺。另一方面,支撑这些通信网络服务的,是一个如此复杂的网络。据不完全统计,截至2022年底,全球运营商已部署无线宏基站物理站点超过700万套,逻辑站点超过1000万套,IP核心设备超过3万套,IP汇聚设备超过20万套,IP接入设备超过100万套,OTN(Optical Transport Network,光传送网络)骨干设备超过15万套,OTN城域设备超过26万套,OTN接入设备超过7万套。特别的,如此庞大的网络系统,约80%是在过去20余年内建设起来的。以中国的移动通信网络为例,这20余年,它跨越了2G、3G、4G、5G四代移动通信技术,直到今天,这四代移动通信网络技术依然在共同服务社会。而且,整个社会对通信网络的需求升级从未停止,未来也不会停止,移动网络、光网络、数据通信网络等正在进入5.5G、F5.5G和Net5.5G的发展阶段。无论从技术跨度还是从规模跨度考量,20余年的发展实在太快,没有足够的时间停下来彻底优化,也没有足够的时间很好地消化技术变革。而快速发展的代价就是网络自身变得越来越复杂,积累下来,对运营商业务的发展形成越来越大的挑战,最为突出的表现在如下3个方面。

首先,业务敏捷和持续创新带来的挑战。网络技术快速发展,给运营商带来新一轮丰富的新业务发展机会。面向消费者的大带宽低时延XR(eXtended Reality,扩展现实)业务、居家+公司混合办公业务、线上+线下远程教育高质量视频业务,以及面向工业领域的高可靠低时延移动专网业务,都正成为运营商的未来业务和收入增长点。适应数字时代的发展节奏,加快创新速度,快速采用新技术,快速推出新业务,在赢得新机会的竞争中胜出,已经成为很多运营商的发展战略。在新建网络上实施业务创新相对容易,而现实是通信网络同时还要支持很多复杂的历史存量业务,多代技术构成的历史遗留网络会与新建网络长期共存,如2G、3G、4G和5G网络共存。实际网络中的业务创新必然会涉及存量网络和业务的大量改动,牵一发而动全身,这不仅制约了创新的速度,也影响了创新的成功。

其次,按需实时保障用户体验带来的挑战。未来5~10年,新型智能化终端会更进一步地快速发展,无人机、VR/AR(Virtual Reality/Augmented Reality,虚拟现实/增强现实)眼镜、机器人等消费终端,以及AGV (Automated Guided Vehicle,自动导引车)、医疗设备、重型机械等数字化行业终端,对用户体验的按需实时保障提出更高要求。通信网络是个性化突出的公共基础网络,具有用户千人千面、设备千站千面的特点。同时,它还是时变的超复杂系统,即用户需求和分布持续变化,环境和设备状态持续变化,持续地升级、扩容、改造,新业务开通和变更持续进行。网络时变的复杂性可能使得一些人的体验变好的同时,另一些人的体验变差,并由此带来用户体验感知跨度大、度量难的问题。目前,只能做到后分析、平均统计的被动式响应,难以满足用户按需精准实时保障的体验诉求,更难以达到运营商期望的预测性处理和主动式响应,且需要将成本控制在可接受范围内。实现对各种类型终端和应用的精准感知,实现SLA(Service Level Agreement,服务等级协定)可保障,提升用户体验和黏性,是通信网络未来的关键创新方向。

最后,网络运维面临架构、流程和人员能力的多重挑战。过去20年,网络不断升级,但运维体系没有发生显著的变化。一方面,通信网络是基础服务,要一直支持存量旧业务,不能随意中断、中止用户服务。网络复杂度的增加带来的运维复杂度逐渐超越人的能力范畴,已经不能依靠线性地增加维护人员来应对网络维护的挑战。另一方面,多样化业务不断创新,也要求网络运维过程以及运维人员能力与之匹配,运维人员需要学习新技能,以适应网络新业务发展需要。而复杂的网络让这一学习过程变得更具挑战性,学习周期也更长。通信行业人员更迭的速度在变慢,这使人才技能空缺的挑战变得更大。同时,缺少网络业务和运维专家的主导,以单纯IT(Information Technology,信息技术)的思路应对网络运维变革和改造,难以有效把握复杂场景和业务诉求,很难取得深入和突破的效果。网络运维当前面临架构、流程和人员能力的多重挑战,成为制约网络进一步发展的重要瓶颈因素。

这些挑战并不是某一天突然出现的,整个通信行业一直在努力应对这些挑战。自2006年起,华为先后提出了基于All IP的FMC(Fixed Mobile Convergence,固定移动网络融合)架构,以及基于Single战略的一系列解决方案,旨在帮助运营商简化网络、降低OPEX(Operating Expense,运营成本)。自2011年起,华为又先后提出了基于Cloud的SoftCOM架构,以及基于All Cloud战略的一系列解决方案,旨在帮助运营商提升用户体验,实现ROADS目标,即Real-time(实时)、On-demand(按需)、All-online(全在线)、DIY(自服务)和Social(社交)。现在回顾一下,在各个阶段,这些架构性创新在应对解决通信网络的重大挑战上都发挥了积极的作用。但也要注意,当时设想的目标都还没有完全实现,仍在实现的过程中,而这也揭示了通信网络的复杂性和应对挑战的艰巨性。

AI的发展为我们解开这些难题开辟了新的路径。传统的通信网络是基于专业人员制定的规则和模型运行的,也基于这一体系不断修补,发展到今天,传统通信网络越来越难以适应网络和业务体验的复杂性、网络环境的不确定性。而AI以数据为中心的机器学习模式,是完全不同于规则系统的一种全新的思维模式,对解决复杂系统问题具有独特优势。从2017年开始,华为提出SoftCOM AI设想,旨在将AI引入通信网络;2018年提出自动驾驶网络架构理念,致力于实现“自动、自愈、自优、自治”(“四个自”)的长期愿景,使能新业务并实现极致客户体验、全自动运维、最高效资源和能源利用。“自动”即基于用户意图业务的自动部署,最终目标是业务全自动部署;“自愈”即预测预防故障并基于事件自我恢复,最终目标是全自动运维;“自优”即根据用户体验自适应调整优化,最终目标是全自动优化;“自治”即在自动、自愈、自优的基础上,实现网络功能自演进。从客户角度,主要体现为“零等待、零接触、零故障”的客户体验;从运营商规划、建设、维护等运维人员角度,主要体现为“自服务、自发放、自保障”的网络运维体验,也就是行业所称的“三零三自”。过去5年多的时间里,我们把人工智能成功应用于100多个通信网络场景,在体验保障、故障管理、网络节能等领域取得了一些突破,验证了人工智能在通信领域的独特价值。基于这些创新实践,在2022年秋,华为发布了Intelligent系列解决方案。同时我们也认识到,通信网络是一个巨大的复杂系统,存在很多独特的场景和技术挑战,如移动网络、光网络和数据通信网络的专业领域业务以及技术差异,面向地理和人口分布的广域覆盖差异,面向用户的移动性与流量变化差异。这些挑战随着时间的累积,还会进一步交叉和混合,问题解决难度进一步增大。更重要的是,通信网络是基础设施,需要始终保证全程全网的正常工作,任何局部的问题都可能引发全网故障。

我们认为,要在复杂性如此巨大的通信网络系统中真正实现人工智能的价值,解决通信网络面临的重大挑战问题,需要在AI和通信网络技术方向上持续展开跨领域的基础理论、网络架构、关键技术和算法以及商业模式的研究创新。而这些需要学术界和运营商、设备商等工业界的共同努力。我们把华为的最新研究进展整理成这本书,分享给业界,希望可以让更多学术研究者、行业专家投身这一领域,促进自动驾驶网络愿景的早日实现,从而推动通信行业的持续健康发展。

党文栓,华为技术有限公司首席战略架构师

前言

人类追求先进生产力的脚步从未停止。每一次技术革命的出现,都代表了一次生产力的发展更迭,驱动人类社会迈向新的发展阶段。三次工业革命(蒸汽机革命、电力革命和信息技术革命)在过去二百多年间实现了人类文明的三次巨大突破,当今,以AI(Artificial Intelligence,人工智能)、5G、云计算等为主导的第四次工业革命所带来的改变悄然发生,正在塑造一个万物感知、万物互联、万物智能的世界。5G、云、视频、IoT(Internet of Things,物联网)、AI等ICT(Information and Communications Technology,信息通信技术)打造的信息流正逐步成为孕育万物的基础。现在的我们,似乎已经可以隐约看到“智能世界2030”的雏形。在未来的智能世界里,空天海地一体化网络无缝覆盖,云边端融合化服务触手可及,全场景智能融入生产生活,通信网络全方位实现自治。通信网络将继续作为推动未来世界发展的主导力量之一,全面迎接智能世界的到来。

当前,随着5G的规模部署和快速商用,快速发展的数字经济打开了数字时代的大门,数字化技术的出现与迭代的速度要快过历史上任何一个时代。企业通过持续调整与变革来抢占先机。新场景、新业务和新客户不仅对“可用性、带宽、时延、可靠性”等网络性能提出倍增要求,更期望获得“在线自助订购、按需分钟级开通、差异化确定性SLA保障、数据安全的专属网络、预防性维护和极简可视管理”等全新网络特性。自智网络正是诞生于这一背景下,通过应用多种智能技术,发挥融合优势,驱动电信行业迈向自动化、智能化,它将对产业的生产方式、运营模式、思维模式和人员技能等带来全方位的深远影响。这一概念自2019年提出以来,得到了产业与标准组织、运营商、供应商等全行业伙伴的积极响应,我们一起倾力投入和全域创新,在产业愿景、目标架构和分级标准等方面达成了广泛产业共识,形成了多组织协同制定行业标准、运营商加速部署实践、供应商联合案例创新的发展态势。华为作为自智网络的倡导者和贡献者,提出自动驾驶网络战略,旨在通过联接+智能,打造一张“自动、自愈、自优、自治”的网络,通过智能原生、数据知识驱动、意图接口交互、单域自治闭环、跨域协同等技术,与运营商和企业共同构建网络“自配置、自修复、自优化”能力,从而为消费者和政企客户提供“零等待、零接触、零故障”的极致体验。本书汇集最新的网络自动化、智能化趋势和进展,并展示华为自动驾驶网络在此领域的最新理论、架构、技术、方法论等方面的成果,目的是尝试回答网络智能化演进过程中的“为什么”“做什么”“怎么做”,希望可以帮助读者对自智网络有清晰的了解,推动运营商和企业开启或加快自智网络建设。

本书首先从自智网络的提出、自动驾驶网络的诞生讲起,结合4个关键应用场景,阐述为什么要发展自智网络。

◆ 第1章,自动驾驶网络的诞生。介绍自动驾驶网络的诞生过程,总结现代通信网络的架构演进,以及网络自动化与智能化的驱动力、产业思路,并阐述自动驾驶网络的总体愿景、代际定义及自智网络产业的发展历程。对于理解自智网络的重要性、自智网络与自动驾驶网络的关系,这些是必要的背景知识。

◆ 第2章,自动驾驶网络的应用场景。介绍自动驾驶网络的4个关键应用场景,包括“天基”与“地基”联动的应急保障、全无线互联的隐形企业局域网、高安全可靠的沉浸式远程办公、确定性广域网的远程控制。

其次,以自动驾驶网络在基础理论、参考架构和关键技术3个方面的阶段性成果诠释自智网络架构与技术。

◆ 第3章,自动驾驶网络的基础理论。体系化总结三大基础理论,包括网络自适应控制理论、网络认知理论、用户和环境智能体模型相关理论。

◆ 第4章,自动驾驶网络的参考架构。系统地介绍自动驾驶网络架构,包括设计目标与原则、顶层架构、 分层架构(包括自智网络引擎、网图、AI Native网元)、关键特征(包括分布式AI、内生安全)架构设计。

◆ 第5章,自动驾驶网络的关键技术。从背景与动机、技术洞察、关键技术方案、技术展望等多个方面系统地介绍自动驾驶网络依赖的8个关键技术,包括网络可信任AI、网络分布式AI、网络数字孪生、网络仿真、网络知识和专家经验数字化、网络人机共生、网元内生智能、网络内生安全。

再次,通过全面介绍业界标准和自动驾驶网络的分级评估方法,以华为自动驾驶解决方案为例,阐明如何推行自智网络。

◆ 第6章,业界标准。介绍自智网络在产业组织、标准组织的分工和最新成果,从国际标准、国内标准、跨组织标准合作3个方面体系化地呈现自智网络标准全景。

◆ 第7章,自动驾驶网络的分级评估。基于分级方法论和示例,介绍如何细化定义具体的分级标准,客观、全面地量化测评各产品领域自动驾驶网络的等级水平。

◆ 第8章,自动驾驶网络的解决方案。 介绍华为打造的系列化自动驾驶网络解决方案,涵盖无线、核心网、IP、企业园区、数据中心、全光接入、全光传送、数智化运营运维等多个领域。

最后是第9章,总结和展望。自动驾驶网络在理论、架构、技术、标准等方面取得的阶段性成果让自智网络充满想象空间,同时也存在很多不确定性,解决相关问题需要全产业共同努力、共同探索。

第1章 自动驾驶网络的诞生

2019年5月,TM Forum[1]联合英国电信、中国移动、法国Orange、澳大利亚Telstra、华为、爱立信6个伙伴,发布了首版自智网络产业白皮书Autonomous Networks: Empowering Digital Transformation For The Telecoms Industry,AN(Autonomous Networks,自智网络)理念正式被提出。该白皮书面向运营商及垂直行业CXO(Chief X Officer,首席XX官)等商业领袖、电信行业的意见领袖(包括行业协会、研究机构、高端专家、分析师等)、电信产业政策的制定者和智囊团、电信设备厂商和O/B域厂商业务负责人等,是凝聚产业共识、发布产业共识的载体,阐述了自智网络的定义、发展愿景、参考框架、L0~L5分级标准,以及单域自治、分层闭环和意图驱动等自智网络核心理念,为电信业提供运营商数字化转型的架构蓝图,给产业各方的实践与合作提供顶层架构参考。自智网络旨在融合网络技术和数字技术,助力运营商和垂直行业数字化战略转型、业务增长和运营效率提升,为垂直行业和消费者用户提供“零等待、零接触、零故障”的客户体验,为运营商和企业网络运营全生命周期打造“自服务、自发放、自保障”的网络运维体验,发挥融合优势使能网络智慧运营。华为作为通信行业的技术领导者,一直拥有对产业方向和前沿技术的敏感性。2018年9月,华为在瑞士日内瓦举办的UBBF(UltraBroadband Forum,全球超宽带高峰论坛)上首次提出自动驾驶网络理念,其内涵和外延与TM Forum此后提出的自智网络理念高度一致;2019年10月,华为正式将自动驾驶网络作为华为自智网络解决方案品牌名称,并面向全球发布了自动驾驶网络解决方案,成为全球首个发布自智网络解决方案的电信设备厂商,并开启了“自动驾驶网络”品牌的铸造之路。

1.1 现代通信网络架构演进

1876年,美国人亚历山大•格雷厄姆•贝尔(Alexander Graham Bell)发明了电话,这种靠两根导线连接送话器和受话器的简易通话装置,成为人类语音通信的开端。直到20世纪80年代,通信网络经过近百年的发展,还仅限于固定电话网络。20世纪90年代,固定电话业务逐渐趋于饱和,移动电话业务以出人意料的速度迅猛增长,彻底改变了通信业务的格局。

过去近30年,互联网打破传统电信领域的疆界,不断将IT引入CT (Communications Technology,通信技术)行业,促进通信网络的快速发展,通信网络由此经历了两次架构性调整:从传统语音和数据通信时代走向IP Native时代,再从IP Native时代走向Cloud Native时代。未来10年,随着以人工智能、数字孪生、网络安全、区块链等为代表的IT不断获得新的突破,并被应用于CT行业,通信网络架构将再次面临变革,进入AI Native时代,形成由固定宽带网络、移动宽带网络、IP网络、云计算和AI等多种技术以及产业组成的ICT基础设施。相关技术和产业各自独立发展,又相互影响、相互促进。现代通信网络架构的演进历程如图1-1所示。

2000年前后,IP技术逐渐成熟并被引入通信网络,通过光纤或者网线承载的IP网络逐渐发展为电信级IP网络。它具有组网灵活、带宽大、成本低、管理方便等特点,因此被迅速推广使用。2006年左右,IP Native成为业界的普遍共识,并主导了通信网络,成为实现万物互联的基础。基于IP Native的网络架构有如下显著优势。

◆ 实现网络互联协议的统一化,极大简化了网元对数据的传输、处理和应用,网络系统实现了信息化。

◆ 能够减少网络层次,降低网络处理复杂度。

◆ 能够提升网络性能,降低网络成本,增强网络扩展灵活性,降低网络管理复杂度。

◆ 是面向未来的技术架构,有利于网络的长期发展演进。

在IP Native时代,早期纷繁多样的网络互联协议统一到IP,网元连接效率大幅提升,网络实现融合,系统实现信息化,是一次网络级别的架构改变。源自计算互联网络的IP技术,不仅成为网络基础设施的重要组成部分,也深刻影响了固定网络和移动网络的技术架构。到21世纪前10年,华为逐渐发展成为ICT基础设施特别是网络架构演进的引领者,是同时拥有固定宽带网络、移动宽带网络和IP网络3个产业且这些产业都具有全球竞争力的公司,由此提出的基于All IP的FMC网络架构以及基于Single战略的一系列解决方案,旨在帮助运营商简化网络、降低OPEX,使华为首次获得了架构性优势。

2011年,在技术、业务、运维等多重驱动下,基于Cloud Native的云化网络架构理念在电信业首次被提出,电信业再次开启网络架构的变革之旅,通信网络进入Cloud Native时代。云化网络架构要求通信网络一方面要实现网络自身云化,另一方面要更好地支撑企业数字化转型和业务上云。首先,针对种类繁多的网络设备管理和维护成本高的问题,通信网络自身云化将多种硬件平台和软件平台升级为统一云平台,带来硬件资源池化、软件架构全分布化和运营全自动化的系统优势,使得资源可以得到最大限度的共享,同时系统具备高扩展性、高弹性和高可靠性,实现云化系统在业务部署、资源调度和故障处理场景的自动化。其次,云计算蓬勃发展,通信网络为了支持云上业务,在架构上做了很大的变革。其中包括以DC(Data Center,数据中心)为中心重构网络,DC成为网络的一部分,IT与CT深度融合,构建了软件解耦、转控分离、资源共享、弹性伸缩、统一调度的云化网络架构。云化网络架构基于Cloud Native,被认为是设备级别的改变,解决了传统通信网络中只能通过设备堆砌的方式进行网络扩容的结构性问题,初步构建了系统自动化能力。由此可见,固定宽带网络、移动宽带网络、IP网络共同构成网络基础设施,为云计算的发展奠定基础。而云计算作为一种独立产业,随着其成熟和壮大,又反向深刻影响了固定宽带网络、移动宽带网络和IP网络的发展方向。与此同时,华为发展成为同时拥有网络产业和云计算产业的技术供应商,提出基于Cloud的SoftCOM架构,进一步扩大了自身的架构性优势,并推出基于All Cloud战略的一系列解决方案,旨在帮助运营商提升用户体验,实现ROADS目标。

展望未来,必将有更多的IT被引入CT行业,对通信网络的整体或者局部发展走向产生深刻影响,而基于网络AI、数字孪生等技术的控制闭环和知识闭环,将驱动通信网络实现完全自治,从根本上解决当前网络规模和复杂性所带来的结构性问题,通信网络将进入AI Native时代。为了实现通信网络完全自治,我们倾向于认为网元设备、网管系统和运营系统要率先实现自治,进而实现整个通信系统自治;同时,网络实现完全自治将涉及众多关键理论和技术,包括网络数字孪生建模和仿真、目标驱动的自动化闭环及协同、网络自我感知能力的构建、网络环境感知和建模、网络自动/自愈/自优/自治技术、网络自适应学习和自演进等,这都需要学术界以及工业界在软件工程能力、计算平台和基础设施、基于AI的网络认知系统、系统和控制理论与应用、人机交互能力、信息安全、网络安全设计等诸多领域通力合作,以取得理论和技术的突破。在AI Native时代,未来网元和网络功能都将基于AI Native进行设计,利用AI强大的数据分析和信息提取能力,通过采集、分析海量网络数据,实现网络状态的感知和预测,并做出决策,为运营商诊断网络质量、优化业务性能、减轻运营负担、改善用户体验带来无限可能。可见,先行发展起来的网络与云计算进一步推动了AI的突破,而随着AI的突破并被引入到CT,它也将反过来影响云计算和网络的技术发展走向。2017年,华为提出SoftCOM AI设想,旨在将AI引入通信网络中,并于2018年提出自动驾驶网络架构理念,致力于帮助电信运营商实现“自动、自愈、自优、自治”的长期愿景,使能新业务并实现极致客户体验、全自动运维、最高效资源和能源利用。

回顾过去30余年并展望未来10年,网络架构演进的过程,本质上是IT的最新实践不断被引入CT,IT和CT相互影响和促进的发展过程。在IP Native时代,通信系统基于IP Native实现了信息化;在Cloud Native时代,通信系统基于Cloud Native推动了自动化;当前,AI Native正在驱动通信系统演进到更高级别的自动化和智能化,通信系统正步入AI Native时代。未来,随着固定宽带网络、移动宽带网络、IP网络、云计算、AI和产业的持续深度融合,CT和IT将发生持续的化学反应,使能ICT基础设施供应商的能力不断增强,并在支持全行业数智化转型的进程中不断做出更多、更大、更独特的贡献。华为也将凭借同时具备固定宽带网络、移动宽带网络、IP网络、云计算和AI五大产业及技术的独特优势,继续引领网络架构演进。

1.2 网络自动化、智能化的驱动力

20多年前,IP技术重构了通信网络转发架构;10多年前,云技术深刻影响了业务架构,包括网络拓扑、流向及核心网业务实现;未来10年,网络将大量使用AI,向AI Native演进。网络为什么需要走向自动化、智能化呢?这可以从电信网络近年来的一些主要问题说起。

运营商OPEX逐年递增。近年来电信行业的收入增长难以跑赢OPEX的增长,OPEX的占比持续保持高位,如果不对OPEX进行结构性的优化,TCO (Total Cost of Ownership,总拥有成本)可优化的空间则非常有限。如欧洲某大型运营商年报显示,2017—2021年的OPEX占收入比分别为68.4%、68.1%、66.9%、67.2%、66.6%。据不完全统计,全球前100多家电信运营商在2015—2020年间的平均营收增长低于OPEX增长,而平均OPEX占收入比接近70%。运营商必须通过提升运维效率的方式降低OPEX。

对人的依赖大。当前,运营商网络很大程度上还依赖于人的经验和技能,各运营商也存在大量运维专家的需求缺口,例如中国电信通过“腾云计划”大量培养上云专家。并且,电信网络越来越复杂,据不完全统计,70%的重大网络故障都是人为因素造成的。同时,面向未来,大量云上的实时性业务更是人的响应速度所无法企及的,必须依赖机器才能高速完成。

客户体验难以管理。电信业务体验不可视,运营流程没有基于用户体验的全生命周期管理,导致当前的用户体验管理大部分是基于投诉驱动的,其余则只能等到网络监控中心发现问题后才得以修复。以家庭宽带业务为例,有58%的体验问题都是通过投诉发现的,而大部分问题因无法被重现被搁置,这也解释了为什么运营商的家庭宽带业务离网率会比较高。

新业务挑战。随着数字化转型向社会各行各业深入发展,越来越多社会生活和商业活动正从线下转移到线上,新的数字化业务和市场遍地开花,ICT产业认为这会是新的产业突破点。例如,2B业务市场就有相当大的发展空间,智慧城市、智慧工厂、智慧医疗等诸多垂直行业目前尚处于起步阶段,在这些行业快速、批量复制差异化的网络应用,对ICT产业将是一个巨大挑战。

当前这些问题并非单点问题,运营商必须下定决心,通过系统架构性的创新来解决这些问题,而全面引入自动化、智能化的架构性变革,初步看,这是众多运营商的共识。TM Forum在2021年4月针对来自46家公司或部门的60位CSP(Communication Service Provider,通信服务提供者)调查对象的一项调查显示[1],CSP已经普遍接受网络自动化和智能化的趋势,相关情况如下。

◆ 针对自动化:94%的受访者表示他们有意愿或正在推行自动化,其中38%的人表示正在现有领域中尽可能多地推广自动化,56%的人表示其组织对自动化已有完整的愿景。由此可以看出,网络自动化的趋势已经被业界广泛认可。

◆ 针对智能化:88%的受访者表示确定或极有可能在10年内大规模部署AI运营的网络,其中54%的人表示确定会部署,34%的人表示极有可能部署。由此可以看出,AI等智能化技术已经深入人心,网络智能化在未来10年将普遍推广开来。

运营商不再只关注网络的精细化运营和高效运营(尽管这仍然很重要),而开始从商业和业务角度思考时代对电信网络的诉求。如上的问题只是表象,并不能从本质上说明网络为什么要走向自动化、智能化,这需要挖掘出背后的关键驱动因素。TM Forum在该调查报告中提出,自智网络的主要驱动因素有改善客户体验、提供新业务、提高效率/降低成本、缩短上市时间等,如图1-2所示。

通过对这些报告结论进行更深入的探究,我们总结出了网络走向自动化、智能化的4个关键驱动力:首先是网络运营与运维效率,效率不高是导致OPEX高、运维依赖人、客户体验不佳的主要原因;其次是新场景与新业务,它是智能时代对更广泛网络应用的需要;再次是新技术,包括AI、数字孪生、安全等各方面的先进技术,正是这些技术让网络全面走向自动化、智能化成为可能,详细技术将在第5章展开介绍;最后是社会责任与可持续发展,网络作为ICT基础设施,要像水、电等基础设施那样服务于社会。

1.2.1 网络运营与运维效率

虽然电信网络在不断演进,网络运营和运维工作也跟随着调整,但是经过多年发展,当前仍然存在一些问题。高德纳(Gartner)调查报告统计的网络运维问题如图1-3所示。75%的网络问题都是由最终用户感知和发现的,并通过投诉向运营商反馈问题,客户体验和满意度很难得到保证;37%的网络故障是由网络变更造成的,当前网络结构越来越复杂,网络的运维管理已远超人的能力;运维人员90%的时间都用来识别故障产生的原因,运维效率低。

电信网络运营商都想改变这些现状,而改变这些现状,首先需要深刻认识到这些问题的本质。是什么导致了这些问题呢 ?问题并不是单点导致的,这需要从运营商庞大的运营和运维的组织、流程与支撑平台来综合看待。

下面通过3个方面,逐步展开对问题及其根本原因的分析和阐述。

第一个方面,网络复杂度增加,导致运营和运维的难度呈几何级数增加,已经超越了人的能力范畴。

虽然用户在使用网络时基本是无感的,但是在网络的背后,有大量的运营、运维人力在持续不断投入。网络涉及由接入网到城域网、骨干网、核心网等相当长的链条,整个网络上业务的设计上线、开通和维护,均需要大量人力、系统协同完成。运维人员面临的困难是怎样的呢?以下从业务、网络技术、网络参与角色3个维度呈现电信网络的复杂性。

业务维度。电信网络具有多业务、多客户体验管理的复杂性。一张电信网络上跑着多种客户业务,例如家庭宽带、个人手机、企业专线等,不同客户的不同业务要实现自动化运行的外部约束各不相同,因此网络系统要能理解不同客户、不同业务的动机和意图。

即使对于无线网络领域,也可能有2G/3G/4G/5G等多代并存,各自服务着不同客户。无线网络的可调参数,在3G、4G时代通过“堆人”的方式还勉强能支撑,但到了5G,其可调参数数量高达2000个,其维护难度已经完全非人的能力所能承受得了,必须借助系统来完成准确的参数调整工作。

在垂直行业的网络领域,各类行业客户也有不同的定制诉求,成千上万的差异化业务诉求,需要运营和运维人员同时掌握相关行业知识,这几乎是不可能完成的任务。

网络技术维度。电信网络存在多网络技术领域、超网络技术领域的复杂性。电信网络既有数据中心网络这种集中的结构化网络,也有区域分布的IP和园区网络,还有海量的末端覆盖的固定接入FTTx(Fiber To The x,光纤到x)和无线网络。

预计在不久的将来,网络将出现超分布、空天地海一体化的情形。在产业难题方面,随着5G成为重要的ICT基础设施,全球将迎来一个超分布式的大规模复杂网络,再加上超分布网络与计算的深度融合,这将使网络架构的演进和整合成为世界性难题,这也将推动产业界团结一致、共同解决。

网络参与角色维度。电信网络全生命周期的运营涉及的角色复杂,多种运营和运维角色同时接触网络,人员繁多。以某运营商为例,从网络规划建设开始,有设计人员、督导人员、施工人员、监理人员会与这张网产生联系。这些人与系统相互交互,让运营、运维关系更加复杂,也更容易出错。

所以,面对如此有难度的网络运营和运维工作,必须改变工作模式,引入自动化、智能化的技术,提升网络本身解决问题、简化问题的能力,将人从这“泥潭”中拯救出来。

第二个方面,网络规模持续增长,而人力主要投入到简单、重复的低效工作中,没有精力投入到高价值的工作(如营销策略、网络规划、风险分析、优化等)中,受OPEX限制,人力相对不足,导致只能被动应对客户投诉,无法主动运维。

GSMA(Global System for Mobile Communications Association,全球移动通信系统协会)发布的《2022 中国移动经济发展》[2]报告显示,2021年全球物联网总连接数已达到 151 亿,预计到 2025 年将增至 233 亿。面向2030年,通信网络将从连接百亿人向连接千亿物的方向发展。随着网络规模及数据量的不断增大,故障发生频率将会更高,当前被动式、没有闭环化的运维难以满足用户对网络稳定性的诉求,且目前市场竞争激烈、获客成本攀升,容易导致用户更快流失,从而带来更严重的经济损失。如果不能扭转这种被动的局面,运营商必然陷入恶性循环的“泥潭”。

2021年在上海举办的世界移动通信大会上,中国移动副总经理李慧镝讲述道:“为了运营好全球网络规模最大、结构最复杂、设备厂商最多的移动网络,中国移动部署了5.9万名网络运维人员,年投入约1400亿元网络运维费用。面对提升网络质量和降低运营成本的双重压力,中国移动将进一步加快推进网络运维数智化转型,全面采用自动化、智能化的技术实现面向客户感知的端到端运维支撑能力,实现业务敏捷开通和网络高效运维。”

实现网络的SLA保障仍然很困难。网络拥塞导致的业务卡顿、闪断、质差随处可见,即便用户投诉后也难以精确定位和快速恢复。当前的用户体验管理都是基于投诉驱动的,75%的网络问题目前都是由最终用户感知和发现的,分析处理速度无法支撑网络故障的提前准确定位,更无法预判网络瓶颈和潜在的问题。60%运营商的运维是“黑匣子”,做不到端到端的可视,在发生网络故障或遇到瓶颈后,无法快速恢复业务或优化网络资源,无法形成端到端的闭环手段并快速解决[3]。故障很难被事前发现和预防,客户体验和满意度难以得到保障。

所以,未来的网络运营和运维必然是“主动”式的,运营商使用先进的自动化、智能化技术武装自己,主动服务好客户,掌握业务发展的主动权,让网络自身承担更多简单、重复的工作。

第三个方面,运营和运维经验不可积累和演进,主要由人工操作,不能继承或成本高,未来需要将经验数字化交由系统完成,重复使用。

当前运营商的运营和运维的经验一般是与场景强相关的,并且大量依赖人工操作,无法移植到其他类似场景,或者移植过程成本很高,且无法自动适应新情况,导致效率提升的工作需要反复做,没有完全发挥出批量快速复制的效能。

相对网络规模来说,当前电信专家资源是稀缺的。中国电信在其2021年的首次A股招股书中写道:“创新开展‘腾云计划’人才培养项目,培养1000名领军IT上云专家。大力培养‘懂行业、懂客户、懂生态、懂技术、会沟通’的产业数字化专家队伍,推选2000名领军的行业专家。”

然而通过简单“堆人”的方式“生产”专家资源越来越不现实,主要原因如下。

首先,培养一个电信专家耗时耗力,且培养模式难以大规模复制。电信专家能力模型要求门槛较高,如图1-4所示,不同的网络专业所需运维知识均不相同,每个专家除了初期学习专业运维知识外,仍需要大量实践来积累经验。单个人通过经验沉淀成为电信专家,一般需要数年时间,而所有经过初步培训的专家种子,都需要分布到不同的工作环境中,所面临的实践环境各有不同,其培养模式自然也没办法大规模复制。

其次,专家资源“陷在”网上事故的“泥潭”中,没有精力投入主动运维的研究中。一个专家处理网上事故的过程不可重复,导致专家只能处理紧急事故,没有时间开展重要而不紧急的预测、预防技术的研究,专家资源几乎全消耗在紧急事务的处理中。

最后,专家培养速度无法与网络运维人力需求匹配。随着网络结构越来越复杂,网络管理的要求已超越人的能力,培养专家的难度越来越大,周期变长,专家资源愈发稀缺,而且年轻人不太愿意干这类重复的事情。

鉴于专家资源与网络运维工作需求间的缺口越来越大,业界提出将运营和运维的专家经验数字化,作为知识库供全网范围引用,既可以避免这些宝贵的专家经验失传,也可以加速专家经验在更广范围的推广应用,提升场景规模复制的效率。专家通过学习这些汇总的经验,又可以抽象归纳出更多高级的经验,再对这些经验进行数字化,注入自智网络中,形成不断演进的良性循环。

关于网络知识和专家经验数字化的技术,是面向更高阶的智能化网络的,目前正在蓬勃发展,但也存在一些关键的技术挑战,需要不断研究和完善,具体可参考5.5节。

综上所述,当前的网络运营和运维效率,已经无法满足网络高速发展的要求,必须借助自动化、智能化的先进技术提升效率,以有限的人力来满足无限可能的业务诉求,同时提升最终用户的客户体验。

1.2.2 新场景与新业务

随着ICT的发展,科技创新和跨界融合逐渐成为全球经济的新发展模式。近几年来,全球企业加速采用5G、AI、大数据、云、边缘计算和数字孪生等前沿ICT改造各行各业。得益于这些科技因素的推动,运营商逐步发掘出了5GtoB、智能制造、智慧医疗、智慧教育等B2B2X(Business to Business to Everything)的全新市场,并有可能在这些新的市场机遇中获得至少7000亿美元的新收入[3]。面向未来,运营商通过创新商业模式和网络服务,不仅要更好地服务B2C(Business to Consumer,业务对客户)市场,更重要的是进入B2B2X的垂直行业,而这些垂直行业市场将是其未来创收的主要来源。代表未来发展趋势的有3类典型的新兴业务:直接服务各垂直行业的2B业务、面向个人体验的融合业务、新型的应急通信保障业务。

Keystone Strategy的报告显示,2025年运营商可参与的全球5GtoB市场规模将达到6020亿美元[4]。2B业务市场相当可观,将在智慧城市、智慧工厂、智慧医疗等诸多垂直行业发挥作用,并且对网络的“连接密度、速率、时延、可靠性、移动性、定位精度”等多项网络性能有着差异化的要求,例如无人机需要500~1000 km/h的移动性,汽车自动驾驶端到端的时延不超过5 ms且需要亚米级的定位精度,工业互联网则需要99.999%的可靠性,这些指标要求网络SLA保障更灵活、可靠。而随着网络规模的不断扩张,2B业务对网络运维能力也提出了更高的要求:面向千行百业百万级应用场景提供高度差异化的可定制连接业务;在线一站式地按需、实时、灵活进行业务订购、开通及变更;端到端确定性SLA可承诺、可保障;实现2B业务领域特征的网络知识积累,自动演进和优化网络。

另外,随着原有的2H业务、2C业务逐步与2B业务发生融合演变,使用公网的手机和家庭网络接入了更多企业类应用,远程居家办公、随处运营、线上+线下混合教育逐步成为常态,在此过程中将出现新的交互需求,比如实时视频、多对多教育、XR沉浸式体验等,由此对基础网络也提出更高的要求。运营商网络必须感知各种家庭终端的应用,实现SLA可保障,保证大上行需要,并确保网络安全可控。传统的手机网络、家庭网络只提供了基本的套餐,无法保障用户的极致体验要求,未来必须在运营和运维上加大投入,提升用户体验。对网络业务的可定制性和用户自助将是基本的自动化需求,而对网络自身的实时SLA保障、主动故障预测预防和智能质差优化,将是增加用户黏性的关键。

通信网络在抗灾救灾、重大事件等场景提供新型应急通信保障业务。新型应急通信逐渐走向卫星化、专网宽带化,使得卫星终端、专网通信终端及相关系统的需求大增。随着5G、卫星、无人机等技术的快速发展,应急通信逐步形成更加全面的能力,包括基于多技术的融合通信能力、灵活的终端/基站移动能力、更广阔的信号覆盖能力,配合智能化的搜救协同、7×24小时服务能力,提供更快速、更高效的应急保障。应急通信对网络的主要诉求有基于多技术手段的智能化协同能力、无间断的可靠服务、简易快速的规划和部署能力等。

综上所述,发展更多的应用场景,将网络延伸到千行百业、空天海陆,抓住这些新的商机,通过提升网络用户体验,收获更多的商业成功,将是运营商的根本诉求。

1.2.3 社会责任与可持续发展

在社会责任方面,以新冠疫情为代表的重大突发性事件让人们的生活、工作、学习方式产生了深刻的变化。疫情不仅对个人和家庭产生影响,同时也对各行各业产生巨大影响,这不仅是经济层面的影响 ,也是社会层面的影响。大量的社会运作和经济活动转移到线上,业务模式发生实质变化,各种非接触连接商业与服务加速兴起,ICT基础设施承载了比平时要多得多的经济活动及社会使命。下面从教育方式和网络运维方式两个方面的改变展开讨论。

第一个方面,教育方式发生改变,从校园走向家庭,从集中式授课转为远程授课。教育是所有人都应该享有的基本权利,在线教育是对网络覆盖与带宽的一次充分考验,大规模的网络授课让网络持续处于高峰期,经常会遇到画面卡顿、音频不同步,甚至画面长时间缓冲等问题。直播网课对网络要求较高,要想获得良好的视频交互体验效果,每个课堂需要独享20~50 Mbit/s优质、稳定的网络带宽。在线教育的连续性对网络的自动化、智能化提出如下更高的诉求。

◆ 面向学校、学生家庭或学生个人,能够提供自动化能力,支持学校、学生或家长快速分钟级自助开通业务。

◆ 面向教育视频,能够针对用户体验实时检测视频质量,秒级感知视频质量的劣化,自动调整网络带宽和路由,并能够提供面向教育应用的加速技术。

◆ 面向网络,能够提供云端、管道和家庭之间的端到端自动化、智能化网络保障,包括故障融合检测、秒级故障定位和分钟级故障解决。

◆ 面向未来的教育新体验和新场景,能够提供VR/AR沉浸式学习体验,全息数字化课堂。

第二个方面,网络运维方式的改变,从现场维护变成线上远程处理。在抗疫实践中,ICT通过空中、地下,流动的、看不见的光和电,打通生命救护的数字走廊,维持社会的基本运作。网络的稳定运行是重中之重,网络运维工程师奋战在网络的各个角落,在家庭侧,支持人们的“宅”生活、白天办公与教育、晚上娱乐的诉求;在政企侧,支持企业办公进行业务扩容、数据中心保障等活动;在疫情防控上,保障新闻发布会、防控视频会议等活动正常进行等。结合疫情的不确定性、最小化控制传播风险的诉求,当前网络的“人拉肩扛”式的运维方式已不再适用,必须做出改变。

◆ 运维主体从以人为主的运维转变为以机器为主的运维。

◆ 运维机制在处置网络故障方面,从基于长流程工单转发处理机制转变为准实时事件“零接触”处理机制。

◆ 在处置网络隐患方面,在周期性基于规则的巡检机制的基础上增加基于机器学习的预测性预防机制。

◆ 将运维知识注入、训练、监督机器,不断提升自动化、智能化能力。

在不断加速的千行百业数字化的进程中,各行各业对ICT基础设施提出了更高的诉求。疫情对网络的冲击也给全球的运营商一个新的视角,来思考和规划面向未来的网络演进。为更好地满足社会资源的高效协同和跨区域灵活调度、大范围的密集动员等需求,通过加强AI等新技术在电信网络中的应用,通信网络走向自动化、智能化,从而可以更好地应对疫情等重大事件。

在可持续发展方面,面对能源、资源、人口、全球变暖等关乎人类生死存亡的问题,气候变化和绿色低碳发展形成全球共识,2015年12月12日,197个国家共同签订《巴黎协定》,成为有史以来首个具有普遍性和法律约束力的全球气候变化协定,制定了将在21世纪全球温升限制在2℃以内、争取1.5℃的目标;在包括中国、日本、美国以及欧洲各国等经济体公布的计划路线图中,绿色发展成为与数字经济并驾齐驱的主要发力领域和全球共识。各行各业低碳发展的新诉求,给ICT提出了新的挑战及更高的能效要求,同时,ICT行业用电量估计占世界总用电量的5%~9%,排放总量占2%以上[5]。内外因素共同作用,加速推动ICT产业的节能减排,实现绿色发展。

数据中心方面,随着AI等算力密集业务场景的成熟及算力多样化持续发展,数据中心功率密度不断提升,同时存在设备种类众多、参数数量大,人工分析方法难以快速找出优化方案的问题。以制冷系统为例,一套制冷系统由64种设备组成,其中空调系统就存在1000多种参数组合。通过引入智能化方法,将大型数据中心作为一个整体,通过数据中心内的传感器收集温度、电量、泵速、耗电率、设定值等各种数据,再对这些数据做AI分析,用分析的结果调整数据中心的运行模式和控制阈值。基于AI算法的决策实现供电、服务器、负荷的协同创新,在支撑密度提升的同时,持续降低数据中心系统PUE(Power Usage Effectiveness,能源利用效率)。

通信网络方面,随着5G的应用,5G每比特能耗比4G有所下降,但吞吐量大幅提升,导致总体能耗上升,为网络运营带来巨大的成本压力,如何实现能耗与性能的最佳平衡是运营商最关心的问题之一。细分来看,在典型移动网络中,无线站点约占整网70%以上的能耗。无线站点的节能优化面临众多挑战:首先,数量众多,业务承载并不相同;其次,覆盖场景复杂多样,包括住宅区、高校、交通干道、商业区等人流密集程度不同、高峰时段不同的场景;第三,相邻基站间互操作耦合性大,牵一发而动全身。传统以专家经验为基础的优化方式已无法满足当前网络的诉求,需要更加自动化、智能化的方法使业务需求与设备运行更加匹配。比如,当移动流量需求较低时,可暂时关闭基站的上载波频段,以降低射频及基带不必要的功耗;通过智能网络管理,可以动态调整网络以匹配波动的需求水平,将消耗的能源降到最低,在不影响网络性能及用户体验的情况下更加节能。这要求网络运营具备自适应控制技术,通过引入自动化、AI智能平台、 机器人流程自动化等技术,主动预测网络能耗, 实现“节能策略自动化、节能模型自演进” 的能力。通过数据自采集、数据自分析、策略自下发、策略自维护,最大限度提高网络节能增益,实现能耗和KPI (Key Performance Indicator,关键性能指标)的最佳平衡。

除智能化外,通信网络自身通过“光电混合”“极简架构”等手段实现节能减排,绿色发展。“光电混合”是结构性提升设备能效的发展方向,通过网络级、设备级、芯片级的光电混合技术,可以持续提升通信设备的能效;“极简架构”打破现有的专业划分,重构网络,形成极简网络架构,降低对算力的需求,降低运维成本,从而实现网络的绿色低碳。

1.3 网络自动化、智能化的产业思路

前文对网络自动化、智能化的驱动力进行了讨论,大规模应用自动化、智能化方法可以简化网络的复杂性,同时提高网络性能、增强客户体验并最大限度地降低网络运营成本。自动化、智能化通常使用AI和ML(Machine Learning,机器学习)技术,使能网络管理和编排方法,解决网络的复杂性挑战并降低OPEX。网络自动化、智能化在产业方面有两种主流探索思路。

思路1:全栈智能化,依托网络内生智能和OSS(Operational Support System,运营支撑系统)丰富的智能应用协同构建新一代的网络。核心是“单域自治、跨域协同”, 以自治域[2]为基础,以网络数字化转型为目标,依托网络域自下而上构建自动化、智能化能力, 实现数字业务闭环的自动化智能商业、业务和资源运营,从而提供最佳的用户体验、最大的资源利用率以及全生命周期运营自动化、智能化。

2019年TM Forum成立了“自智网络项目”,其目的是构建业界领先、端到端网络自动化、智能化的方法,帮助运营商简化业务部署,推动网络Self-X能力(自服务、自发放、自保障)全面提升。2021年11月,TM Forum联合CCSA(China Communications Standards Association,中国通信标准化协会)、中国信息通信研究院、运营商、厂商等35家产业伙伴,共同发布《自智网络(Autonomous Network)-赋能数字化转型白皮书3.0》(简称自智网络白皮书3.0),宣布自智网络进入“规模化试点验证和体系化现网部署”阶段。典型的方案是华为的自动驾驶网络解决方案。

图1-5所示为自智网络分层参考架构。该架构通过3个层级和4个闭环配合达成目标 。

◆ 3个层级包括Resource Operation Layer、Service Operation Layer和Business Operation Layer,为便于理解,本书分别用资源运营层、业务运营层和商业运营层表述。3个层级面向不同目标,通过引入AI,提供本层自动化、智能化能力,可支撑所有场景和业务需求。

◆ 4个闭环(资源、业务、商业、用户)实现层内或层间全生命周期交互,其中资源运营层通过专业自治域、自治域协同,实时/近实时完成资源闭环,屏蔽网络复杂性。用户闭环完成用户端到端的大闭环。3个层级间通过意图驱动式极简API(Application Program Interface,应用程序接口)进行交互,屏蔽交互复杂性。

思路2:将网络功能软件化、智能化能力构建在OSS层,依托OSS自顶向下定义通信网络整体架构,其架构如图1-6所示。典型方案是网络功能软件化+ONAP(Open Network Automation Platform,开放的网络自动化平台),在网络层,通过虚拟化方式构建网络功能,实现硬件和软件的分离;在OSS层,通过ONAP开源解决方案构建自动化平台,提供平台公共功能,包括生命周期管理、AI/ML训练和执行、安全性、数据管理、策略、分析、服务和资源编排等,OSS层中的多供应商App(Application,应用)可以使用这些功能构建自动化、智能化应用程序,运营商负责水平和垂直两个方向的集成,从而自顶向下定义和管理网络。

图1-6 网络功能软件化架构

注:VNF为Virtual Network Function,虚拟网络功能;PNF为Physical Network Function,物理网络功能ONAP为Open Networking Automation Platform,开放网络自动化平台;vCPE为virtual Customer Premises Equipment,虚拟用户驻地设备;VoLTE为Voice over Long Term Evolution,长期演进语音承载;BBS为Broadband Service,宽带业务;CCVPN为Cross Domain and Cross Layer Virtual Private Network,跨域和跨层虚拟专用网; FCAPS为Fault, Configuration, Charging, Performance, Security ,故障、配置、计费、性能、安全;DCAE为Data Collection, Analytics and Events,数据采集、分析与事件上报;sVNFM为specialized Virtualized Network Function Manager,专用虚拟网络功能管理。

网络自动化、智能化将大幅提升运营商的效率并使能全新的数字化业务,同时通过使能新业务,改变社会与千行百业,这已成为业界的共识。本书主要阐述思路1,围绕华为自动驾驶网络展开论述。

1.4 自动驾驶网络的总体愿景

在网络自动化、智能化的浪潮下,华为结合客户需求及技术发展趋势,提出自动驾驶网络总体愿景(如图1-7所示):通过数据与知识驱动的智能极简网络,实现网络自动、自愈、自优、自治,使能新业务并实现极致客户体验、全自动运维、最高效资源和能源利用。

该愿景主要包括如下4个方面。

自动:基于用户意图业务的自动部署,最终目标是业务全自动部署。网络自动,是指根据用户业务意图,结合当前网络资源、状态和拓扑等信息,自动完成业务意图到网络内部业务请求的解析,同时,自动实现业务请求到各个部件的协同并完成设备命令的配置执行,最终实现用户业务意图部署的全自动化。

要达到上述目标,首先,需要瞄准用户业务意图的自动化达成,即将用户业务意图分解为网络意图,并基于网络意图设定实现目标,围绕目标,不断寻找和尝试可行方案,实现用户业务意图的持续、自动达成。其次,需要结合网络知识和经验实现高效、智能的自动闭环控制,即需要网络中的管控系统及设备单元能共享网络知识和经验,通过基于知识的交互提升通信效率,并结合知识和实时感知到的网络状态,智能完成闭环的决策和执行。

自愈:预测预防故障并基于事件自我恢复,最终目标是全自动运维。网络自愈,是指实现全场景的自动化运维,全自动识别或预测各类网络故障及其组合,自动利用可调度的网络资源和维修人力,采取适当的补救行动恢复业务,尽最大可能减少业务损失。网络故障处理模式由“被动”变为“主动”:原来网络被人指挥,现在变成网络指挥人完成硬件类故障维修,甚至软件类故障都不需要人,网络自己完成“维修”,实现自愈。

要达到上述目标,需要通过网络生存性仿真和高可用网络拓扑进行设计,使网络生存性满足要求。还需要基于用户业务SLA目标,根据网络状态进行实时调整,以便持续地满足用户业务的SLA。同时,事前自动防御故障、预测故障,事中保证故障自动修复及快速准确派单,事后在人的辅助下完善自愈过程,达成日常故障处理全自动运维、没有用户投诉的目标。

自优:根据用户体验自适应调整优化,最终目标是全自动优化。网络自优,是指根据用户指定目标,结合网络环境、资源、状态的变化,基于网络知识和内生内建的学习、优化算法,快速地对网络参数和资源配置进行各个层次的动态调整,逐步适应网络新的变化,最终使网络的运行达到预设的最优状态。

要达到上述目标,需要通过端到端的自主优化,激发网络潜能,为用户提供最佳体验;基于集中+分布的方式,高效利用网络资源,发挥网络最大潜能,降低网络维护成本;结合网络深度感知和环境感知,实现网络较低的能耗水平和碳排放水平,构建低碳节能的通信网络。

自治:在自动、自愈、自优的基础上,实现网络功能自演进。网络自治,是指让网络像人类一样,通过学习逐步建立对网络世界的正确认知,包括网络内外部环境的感知、网络知识的积累以及基于知识的推理,具备适应性决策能力,可解决复杂的不确定性问题,达到网络自己治理自己的目的。

要达到上述目标,需要构建自智网络系统的智能化底座,提供平台和框架,支撑完成控制闭环,实现自主的适应性决策,支撑自动、自愈、自优功能运转,最终使能新业务并实现极致客户体验、全自动运维、最高效资源和能源利用。还要通过建立认知闭环,支持知识注入和知识生成能力,实现系统的持续自学习、自演进,不断“反哺”到自动、自愈、自优能力中,从而使能网络完全自治。

华为联合TM Forum、GSMA及领先运营商共同研究和探索,发布自动驾驶网络白皮书和案例报告,对自动驾驶网络的目标、框架及L0~L5智能分级达成产业共识,逐步形成了自智网络的产业格局。

TM Forum从标准层面正式提出了自智网络愿景,自智网络旨在通过完全自动化的网络和ICT的智能化基础设施、敏捷运营和全场景服务,利用前沿技术实现“将复杂留给供应商,将极简带给客户”。此外,还需支持自服务、自发放、自保障的电信网络基础设施,为运营商的规划、营销、运营、管理等部门的内部用户提供便利。自智网络愿景如图1-8所示[6]

1.零等待

零等待是指自智网络能有效缩短客户等待时间,避免客户诉求长时间得不到有效处理。零等待主要体现在客户从运营商处了解、获得并使用网络业务的过程中,分阶段介绍如下。

客户了解网络业务阶段:客户根据自身需要给运营商提出业务诉求,期望运营商尽快提供可行的网络业务方案,以便了解业务详情。而当前新网络业务的TTM(Time To Market,产品上市周期)长,主要问题是由于涉及多网络专业多部门协同设计和建设、流程复杂,无法快速响应,导致客户流失。此时需要网络根据业务发展趋势,提前识别扩容需求,主动扩大网络覆盖范围,并提供灵活的跨领域编排能力,支持新网络业务快速上线运营,缩短TTM,更快获取客户认可。

客户获得网络业务阶段:客户确定购买网络业务后,期望快速投入使用。而当前网络业务涉及跨地域、跨网络专业的协同交付,介入环节多,导致总体耗时较长,影响客户的使用。此时,需要网络具备自动化的闭环控制能力,根据客户业务意图,快速开通和验收,在网络预覆盖良好的情况下,实现即开即通的极致体验。针对后期网络变更,也能即变即通。

客户使用网络业务阶段:客户在使用网络业务的过程中,期望网络稳定、质量好,对网络故障、网络质量问题期望无感知或快速自动修复。而当前如果网络出现故障,大多需要客户投诉来触发,故障受理又涉及多网络专业协同诊断、分析、修复,步骤多,导致响应慢。此时,需要网络具备故障快速自愈的能力,对于物理设备问题,能主动通过冗余资源优先满足客户需求,后续尽快通知运维工程师修复物理设备,保持可持续服务的能力。

零等待的预期目标是客户提出网络业务诉求后,自智网络能在极短时间内获得可用的服务,不再像之前需要等待超长时间。网络故障能分钟级闭环处理,对于一些成熟的业务,可以达到秒级闭环处理,即开即用,极大地提升客户的服务体验。

2.零接触

零接触是指自智网络能有效优化客户获取网络业务及保障的方式,客户不再依赖营业厅、客服及上门的运维工程师来获取网络业务及保障,可获得电商化的便利体验。零接触主要体现在客户从运营商处了解、获得并使用网络业务的过程中,分阶段介绍如下。

客户了解网络业务阶段:客户期望更便利地提出网络业务诉求,并更直观清晰地获取可选的网络业务信息。而当前新网络业务一般是客户到营业厅洽谈,由于营业厅的营业时间和营业范畴的限制,还可能需要多次前往,非常不便利。此时需要网络提供电商化的自助服务能力,能准确有效地收集客户的业务诉求,主动推荐合适的业务产品,并能够做到质量预知,给客户可承诺的保障,帮助后续业务的办理。

客户获得网络业务阶段:客户期望提出网络业务诉求后,网络业务能按要求一次性开通成功,不希望运营商不同人员反复多次沟通、上门处理。而当前网络业务一般需要人工上门处理,需要与客户多次交互,包括客户侧的资源勘测、网络安装对接、调测验收等多个环节,客户可能需要反复说明情况,多次确认和催促,并多次接待工程师上门,对客户造成不必要的困扰。此时需要网络根据业务发展趋势提前做好网络预覆盖规划,在客户提出业务开通诉求后,能一次性开通和验收,实现即开即通的极致体验。

客户使用网络业务阶段:客户在使用网络业务的过程中,期望网络故障、质量问题能自动修复,不希望运营商不同人员反复多次沟通、上门处理。而当前如果出现故障,大多需要运维工程师上门检查核对,确认问题原因后,还要再次上门修复网络,影响客户使用体验。此时需要网络具备自助维护、远程诊断、自动修复能力,对于物理设备问题,最多只需要上门一次即可解决。

零接触的预期目标是无论企业用户还是个人用户,均可以通过电商化的自助方式获取“订购/变更/维护/优化”等各种服务,极大地满足客户随时按需的服务诉求。未来提供自助的方式可以是多样化的,包括各种手机/平板类App、PC端应用或Web服务站点,甚至可以将自助界面直接延伸到客户侧的终端(如家庭调制解调器,俗称光猫)上。随着自智网络的不断演进,最终用户可以百分之百地通过自助方式获取网络服务。

3.零故障

零故障是指自智网络能有效提升对客户业务的保障,避免业务出现故障或劣化,客户对网络故障、网络质量问题无感知或感知不明显,可获得高可靠的业务体验。零故障主要体现在客户使用网络业务的过程中,具体可分为故障前、故障中、故障后3个阶段。

故障前:在网络出现故障前,自智网络能监测到网络劣化趋势,准确推测出网络可能出现的故障及对客户业务的影响,优先采取预防措施,在预防后仍存在风险的情况下,主动告知客户风险,让客户有所准备。

故障中:当网络故障无法避免、最终发生后,自智网络优先使用倒换等快速修复手段,保障客户业务不受影响,若由于特殊原因(如多路网络同时发生硬件故障)无法通过软件配置快速修复的,能第一时间告知客户影响、处理计划及给客户的规避建议,同时调度故障处理流程完成修复。

故障后:当网络故障得到处理后,自智网络需要第一时间告知客户,并做好善后工作。

这就要求自智网络能通过加强对业务、服务和基础设施的故障预测预防、质差问题预测预防、故障自动修复,实现“主动运维”,使网络性能质量能持续满足服务承诺,主动关怀客户,使用户体验超预期。如果由于任何原因出现性能劣化,网络能自动分析并决策如何优化,保障网络质量;如果有潜在的故障风险,网络能主动实时预警风险,并自动启用预案或分析可行的方案来消除风险;即使故障发生了,网络也能自行发现、自发诊断故障并修复。

零故障的预期目标是高度保障用户的网络服务,主要通过超高的业务可用率提升用户的满意度,减少用户投诉。可以预期,将来自智网络的可靠性将提升10~100倍,业务可用率普遍可以达到99.9999%。

为了更好地支撑Zero-X体验最终落地,TM Forum在自智网络白皮书3.0中提出了自智网络需具备的Self-X运营能力,如表1-1所示。

由于以上范围涉及商业、交付等运营商企业强相关流程(例如自营销、能力交付),自监控/上报属于较成熟能力,本书暂不逐个展开介绍,而聚焦于自配置、自修复、自优化,后文中涉及的“Self-X”也默认为本书聚焦的自配置、自修复、自优化3个部分。

第一,自配置。自配置是指自智网络能对业务端到端部署、变更、升级提供自动化支撑,减少人工配置,并通过业务意图自动翻译为网络配置,在减少网络配置工作量、降低难度的同时,也减少人为失误带来的故障,提升业务开通和调整的效率。自配置主要体现为网络运维人员对网络进行日常维护、对客户业务申请进行部署实施的过程。

网络的日常维护(例如系统升级、扩容等)能由运维人员提前规划维护任务,系统根据维护要求,能提前做网络状态检查,并对维护任务进行仿真,确保流程动作无误后能自动快速实施,减少对网络业务的影响,事后能实时检测,评估维护任务的完成情况,整个过程再无须运维人员介入。对于客户业务的开通、变更诉求,将不再完全由客服和运维人员主导,自智网络可以自动受理客户自助发起的业务申请,并能保证业务自动成功开通、变更。

自配置的预期目标是自智网络能在运维人员不干预的情况下自动受理所有业务申请,使业务自助开通率趋近100%,并能通过规划全自动维护任务的方式,主动完成所有日常运维活动。

第二,自修复。自修复是指自智网络能在业务保障过程中进行自动化故障处理,实现故障预测预防和快速修复,保障业务高可靠运行。根据处理能力的不同,故障可分为软件类故障和硬件类故障。对于软件类故障,自智网络能自动通过软件参数调整、重置、倒换等方式自愈;对于硬件类故障,自智网络能辅助现场工程师实现问题的快速修复。自修复主要体现为网络运维人员对网络进行故障处理的过程。

网络运维人员不再时刻监控网络故障情况,只需要提前规划好各类故障的原则性策略,后期可以由自智网络自动完成对故障的监控、预防、修复等动作。针对业务纷繁复杂的故障,能寻找故障发生的规律和根因,预测预防故障发生,并自动规避故障,实现故障自动修复。

自修复的预期目标是当新业务运行一段时间后,自智网络能根据故障发生规律,不断积累故障预测预防和自动修复的知识,针对软件类故障,实现接近100%的故障自动修复率,针对硬件类故障,能辅助网络运维人员完成修复,极大缓解网络运维人员应对故障的压力。

第三,自优化。自优化是从业务质量角度进行持续的自动化优化过程,通过感知整网的业务质量情况,调整网络参数,最终满足网络优化的需求,使网络效能得到最大程度的发挥,主要体现为网络运维人员对网络进行质量优化的过程。

采用传统网络运维方式,通常在业务出现质量劣化时系统无法实时感知,而发现问题后,运维人员需要较长时间才能介入,自智网络需要从根本上解决这些问题。未来,网络运维人员不再时刻监控网络质量情况,只需要通过提前确定网络质量优化的策略性目标,即可由自智网络对业务和网络质量实现自行优化。通过对网络性能指标的实时监控,分析指标的变化趋势,结合网络质量问题出现的规律和相关运维知识,可以预测出网络即将出现质量劣化的风险,通过仿真确定可行的调优方案,自动启动优化任务,即可确保网络始终处于最优状态。

自优化的预期目标是通过网络自身的感知、智能预测和自动调优能力,实现全自动优化。自智网络需要提高对业务劣化趋势的预测,尽量提前预防劣化出现。当出现业务劣化后,自智网络能自动进行优化,无须运维人员介入,其自动优化率将逐步逼近100%。

1.5 自动驾驶网络的代际定义

达成华为自动驾驶网络“自动、自愈、自优、自治”的总体愿景,并支撑自智网络产业实现“Zero-X和Self-X”的产业目标,需要产业各方不懈努力和协同,对网络融合感知、人机智能化协同和决策、意图驱动闭环等诸多难点不断进行关键技术突破,这是一个长期演进的过程。为了更好地支撑自智网络产业长期可持续发展,需要对自动驾驶网络进行代际划分和定义,并在业界范围内对自智网络的代际演进形成统一认识、统一标准、统一目标。

华为自动驾驶网络本质上是一个非常复杂的自动化系统,而自动化系统的演进过程,简单地说,就是用“系统自动化能力”来代替“人工操作”的过程。自动驾驶网络的自动化特征,就是在尽可能少的人工干预下,满足网络运营商对网络运维管理的各种需求,如故障处理、质量优化、业务开通等。

早在2000年,美国乔治•梅森大学工程心理学教授雷杰•帕拉休拉曼(R. Parasuraman)就提出了对自动化系统进行等级划分的理论基础[7],主要包括以下3个核心观点。

第一个核心观点是自动化系统中的各个任务,建议按“信息获得”“信息分析”“决策和动作选择”“动作执行”4个阶段进行任务分类。

第二个核心观点是针对以上每个阶段的任务,从“全人工”到“全系统”的自动化演进方向,基于人机分工,从低到高划分若干个连续等级,而不是从全人工直接跳变到全系统。

第三个核心观点是在一个特定的自动化系统中,对于不同阶段下的任务,其自动化能力和要求存在差异性,也就是说,不同阶段的任务在自动化系统演进过程中,其自动化水平可能存在差异,比如“信息获得”任务已经自动化,“决策和动作选择”任务还处在人工或半自动化水平。

其中,针对“决策和动作选择”阶段任务,帕拉休拉曼教授给出了从完全人工决策到机器完全自主决策的自动化分级示例,如图1-9所示。

目前各行业自动化系统也结合本行业特点细化定义了代际和分级标准,如IEC(International Electrotechnical Commission,国际电工委员会)定义了关于ATO(Automatic Train Operation,自动列车运行装置)的自动化代际分级定义(IEC 62290-1),SAE International(国际自动机工程师学会)定义了关于汽车自动驾驶的代际分级定义(SAE J3016-2021)等。

这些代际分级定义的思路是高度一致的,均将自动化系统分解为通用的任务活动(如在ATO中,通用任务包括列车启动、列车停止、开关车门等;在汽车自动驾驶中,通用任务包括加减速、转向、环境监测、紧急情况决策和处理等),并从“人(如司机等)”到“系统”的演进方向进行代际划分,同时考虑了不同任务活动的自动化水平在代际演进过程中的差异,与帕拉休拉曼教授提出的自动化系统分级理念非常匹配。

参考以上自动化系统分级理论和业界主流分级实践,经过自智网络产业界各方充分讨论,自智网络代际定义如图1-10(引用自TM Forum标准IG1218[8])所示。

在TM Forum的自智网络分级代际定义中可以得出如下信息。

将自智网络划分为L0~L5这6个代际,L0最低,L5最高。自智网络相关任务活动抽象总结为“意图/体验”“感知”“分析”“决策”“执行”5类认知闭环活动[即I-AADE(Awareness、Analysis、Decision、Execution,感知、分析、决策、执行)闭环],每类活动基于人机分工,从P(人工)→P/S(系统半自动)→S(系统全自动)的演进方向进行划分。

不同认知活动的自动化演进节奏存在差异。例如,执行活动一般是确定的、偏客观的,其技术难度相对较低,在L2达到全自动;决策活动一般是不确定的、偏主观的,依赖AI等智能化技术,技术难度相对较高,在L4达到全自动。

在适用性方面,L1~L4针对的是选定场景,L5针对的是所有场景,即L1~L4等级的达成是限制在选定的有限场景下,而达成L5需要在所有的场景下,即不限制场景。

华为自动驾驶网络的代际遵从TM Forum自智网络代际划分和定义,关于TM Forum自智网络L0~L5代际的详细解读,可参考TM Forum标准IG1218[4]文档,本书不赘述。

除了以上基于认知活动+人机分工来划分自动驾驶网络代际的方法,在华为实践自智网络的过程中,也存在基于成效指标或技术特征来划分代际的观点。

基于成效指标进行代际划分是基于指标的取值来划分代际(如××指标下降50%就是L3),这种方式缺乏技术驱动或演进路径,无法有效牵引短板分析和自动化能力提升,如通过投入更多的人力也可以缩短MTTR(Mean Time to Repair,平均修复时间)指标,但违背了自动驾驶网络的理念和初衷。同时成效指标的选取、计算、目标值等与具体的实施产品、具体的业务和场景强相关,很难在公司范围内形成一个统一的、通用的代际共识。成效指标更适用于华为对自动驾驶网络的预期成效进行目标定义和等级提升后的自动化效果进行评估,而不建议直接通过成效指标来划分自动驾驶网络代际。

基于技术特征进行代际划分是基于使用了哪些关键技术(如数字孪生技术、网络仿真、AI知识推理技术等)来划分代际,这种方式是从“如何实现自动驾驶网络”的技术视角来进行代际划分的,需要对自动驾驶网络的内部实现方案和技术有较多的了解,评估举证较困难。这种方式要求达成某个等级,必须使用某些技术来实现自动化,不利于各产品领域进行技术开放创新、寻求新技术的探索和突破。另外,自动驾驶网络存在很多场景,有些场景确实需要使用比较复杂的技术来实现,而有些场景相对简单,不需要复杂的技术也可以实现全自动化,如果严格按技术特征来划分代际,这些简单场景就无法达到高阶等级。通过外部可感知的人机分工方式来划分代际更加合理,因为技术和实现方案只是等级提升的手段而不是目的,所谓“不管黑猫白猫,抓到老鼠就是好猫”。技术特征可以用于指导系统如何实现自动驾驶网络,作为华为各产品领域在系统自动化、智能化能力建设过程中的重要参考。

本节介绍的代际定义是当前华为自动驾驶网络的通用抽象总结,是自动驾驶网络向自动、自愈、自优、自治演进的总体分级框架。在华为各产品领域实际落地过程中,为了对各领域进行细粒度的分级评估,还需要基于此框架细化定义具体的分级标准和评估方法,具体参见第7章。

1.6 自智网络产业的发展历程

自TM Forum于2019年提出“Autonomous Networks”(简称AN),历经3年,自智网络理念和产业愿景已在行业达成共识。运营商纷纷开始制定自智网络阶段目标和长期战略,并积极开展实践。此外,产业各方正在积极探索L3和L4标准,共同推进标准体系的成熟。

综合业界在自智网络领域的探索与实践情况、自智网络的等级划分、技术发展预期等因素,自智网络的发展可以划分为4个阶段:产业形成期、L3发展期、L4发展期、L5发展期,如图1-11所示。

1. 产业形成期

产业共识逐渐形成。行业领先的运营商、供应商围绕“目标架构、分级标准、评价体系和运营实践”4个要素开展工作, TM Forum、CCSA、3GPP (3rd Generation Partnership Project,第三代合作伙伴计划)、ETSI(European Telecommunications Standards Institute,欧洲电信标准组织)等九大产业和标准组织纷纷启动标准或研究立项,并建立了跨标准组织AN技术协同平台(AN Multi-SDO),加速行业标准落地。2022年9月,TM Forum与产业伙伴共同发布了自智网络白皮书4.0,其中参与的产业伙伴由原来的6家迅速增长到54家。同时,CCSA、中国信息通信研究院与TM Forum将AN译为“自智网络”,倡议“通过打造自动化、智能化的网络,牵引网络服务迈向新台阶,促进网络向融合化、智能化、绿色化发展”。

跨组织协同加速标准落地。TM Forum提出的“三零三自”、三层四闭环目标架构、L0~L5分级标准以及“单域自治-跨域协同、意图化交互”等核心理念在产业取得广泛共识后, 3GPP、ETSI、IETF(Internet Engineering Task Force,因特网工程任务组)、CCSA等标准组织也纷纷启动各专业领域的自智网络标准立项,并借助AN Multi-SDO开展协作配合,使得自智网络标准体系逐渐完善,初步形成了“需求用例+参考架构+分级标准+技术规范”“通用标准+多专业标准”的标准体系,为提升产业协同效率、繁荣产业生态奠定了基础。其中,华为在TM Forum、3GPP、ETSI、IETF共担任14个高端标准职位,并积极贡献、推进30多项标准立项,共同加速标准的成熟与产业发展。

运营商开始制定阶段目标和长期战略。根据TM Forum《2021年度自智网络发展调研报告》,约88%的被访者表示肯定或非常可能会在未来10年大范围部署自智网络,最主要的驱动因素是“改善客户体验、提供新业务、提效降本、缩短上市时间、零接触合作”。除此之外,全球领先运营商已纷纷制定了自智网络的阶段目标和长期战略。中国移动在2021年初明确提出2025年全网全专业达到L4级自智网络的战略目标。为了确保该目标顺利达成,中国移动提出了“2个目标”(围绕客户发展和质量领先)、“3个闭环”(实现单专业网络资源管理、跨专业端到端业务管理和客户需求管理)、“4个层次”(协同网元、网络、业务、商业)的自智网络“2-3-4”体系架构。中国电信将自智网络建设作为“云改数转”战略的关键部分,明确2025年云网运营自智能力基本达到L4。中国联通以“2023年自智网络达到L3、2025年主要场景达到L4”为目标,通过顶层目标规划与多项技术融合创新,牵引网络智能化、数字化升级。海外领先运营商,如Vodafone,将ZTO(Zero-touch Operation)定义为集团“Tech 2025”战略方向之一,提出到2025年故障自动化、配置自动化、可预测性维护领域要达到L4。MTN集团为了更好地落实“Ambition 2025”战略,提出了2025年实现自智网络L4的目标,计划构建包括“自智网络蓝图、敏捷DevOps(Development & Operations,开发和运维)环境、高性能网络、创新价值用例”等自智网络框架。AIS公司提出基于TM Forum架构, 2025年无线客户投诉、事件管理领域达到L4的目标。

厂商发布创新解决方案或白皮书。为支撑运营商开展自智网络的探索与实践,厂商纷纷从基础研究、技术架构、产品、解决方案多个层面布局自智网络的研发工作,并向业界发布其最新研究成果。如2019年10月,华为发布自动驾驶网络解决方案,是全球首个发布自智网络解决方案的厂商;2020年11月,爱立信发布意图网络研究报告“Cognitive processes for adaptive intent-based networking”; 2021年12月,清华大学智能产业研究院、亚信科技、中国移动、中国电信、英特尔联合发布《通信人工智能赋能自智网络》白皮书,提出人工智能、网络数字孪生等将成为驱动自智网络发展演进的关键技术。

综上所述,在华为与产业各方的共同努力下,自智网络产业已逐渐形成。然而,自智网络从理念到实现,还需要推进产业各方开展更广泛和深入的合作,牵引产业按照代际有序演进。从TM Forum 2021年的调研报告《自智网络:商业和运营驱动》可了解到,大多数的运营商希望未来3年引入L3级自智网络能力。因此,2022—2025年将是L3级自智网络蓬勃发展的时期。

2. L3发展期

L3发展期是自智网络标准体系建设的关键阶段,各标准组织聚焦于制定和完善L3、L4标准。而2025年是自智网络达到L4的关键里程碑,意味着自治域能够达到基于意图的闭环自智能力。意图接口作为自智网络达到L4的关键接口能力,将会成为2022—2024年的标准化重点,同时意图驱动的闭环自治技术、分布式AI等也会成为标准化的热点。

聚焦L3、L4标准制定,并遵循“先完善通用标准,再制定细分领域标准”的原则。L3发展期的标准建设将起到承上启下的作用,一方面需要向前推进L3标准建设,另一方面也要为L4发展做好铺垫。在产业形成期,由标准组织构建的“通用标准+多专业标准”的标准体系,由分级标准、评价体系、架构、接口、关键技术5个部分组成。而TM Forum发布的通用架构和通用分级标准作为通用标准的一部分,还需要各标准组织进一步完成细分领域标准的制定,同时遵循“先完善通用标准,再制定细分领域标准”的原则,持续推进和完善标准体系的建设。2022年,部分标准组织已取得了较好的进展。例如,CCSA建立了与TM Forum、ETSI等国际标准组织的合作机制,而AN Multi-SDO在2021年形成的合作意向基础上,于2022年开始深入探讨具体的技术合作内容。

意图接口完成标准化,作为自智网络达到L4的关键接口能力,是标准工作的重点之一。自智网络的演进将不断引入新的自动化与智能化能力,也需要新的接口能够与周边协同更高效、支持更高等级自智网络的部署,使能运营商提质增效、敏捷创新。而产业提出意图接口,正是为了支撑运营商的上述诉求,其标准化也将成为这一阶段标准工作的重点之一。2022年,华为与产业各方包括MTN、AIS、VDF、VNPT、Telenor、TIM、Orange、中国信息通信研究院、爱立信、Intraway、CloudBlue等15个单位,基于TM Forum提供的Catalyst平台,以“意图驱动的自智网络”为主题组建催化剂项目组,共同探讨和定义意图接口框架,并基于各领域的价值案例进行分场景定义接口。该项目的有益尝试将极大促进意图接口走向标准化。伴随着意图接口的标准化进程,各组织之间的意图接口互通性测试也会逐步开展。

构建自智网络评测体系,促进产业良性发展。当前自智网络还面临着“产业协同不充分、代际演进不统一、商业价值不突显”等发展难题,在向L4目标演进发展的过程中面临着更大的机遇和挑战。在这个背景下,中国信息通信研究院于2022年上半年发布了自智网络领航者计划,与产业伙伴共同应对以上挑战。该计划旨在牵引用户需求和产业标准,引导垂直行业和公众用户根据生产经营场景选择最合适的业务和服务,引领自智网络全产业伙伴按照统一分级标准共同研究和构建高等级的自智网络,牵引运营商、软硬件厂商的服务能力,网元设备、产品/解决方案的能力提升,推动产业快速、良性发展。该计划主要包括伙伴计划和评测认证计划两部分:伙伴计划主要是招募实验室伙伴共建产业生态,建成多场景、端到端测试验证环境;评测认证计划将开展面向解决方案和网络对外服务两大能力的评测,一方面评测厂商解决方案的自智能力,作为电信运营商采购活动的参考,另一方面评测运营商为其用户提供服务的能力,作为用户选择运营商的参考。

3. L4发展期

到2025年,随着全球数字经济规模的不断扩大,新技术的运用、联网设备的激增、企业转型与社会变化等都有可能超过当下的预测和预期。GSMA预测,2025年全球物联网连接总数将达到246亿,其中85.7亿是移动连接,18亿是5G连接。与此同时,运营商可参与的5GtoB市场空间将逐步扩大,而基于2B业务要求敏捷创新的强大驱动力,运营商对自智网络的诉求也将持续强化,全球自智网络建设将迈向成熟期。自智网络产业主要出现几个方面的变化:场景化意图接口实现规模商用;网络设备演进到内生智能,自智网络逐步达到L4级,即实现单自治域自适应闭环;人机关系实现人机协作,网络以机器为中心,机器动态生成流程,指挥人配合其开展工作;产业各方开始探索L5自智网络,并发布L5的早期标准。

4. L5发展期

到了2030年左右,通信网络将经过L4的升级换代,网络自动化与智能化能力得到跨越式发展,产业开始深入探索L5自智网络。预计这个阶段6G(6thgeneration Mobile Communications Technology,第六代移动通信技术)、F6G将规模商用,网络连接数、带宽、时延、安全等能力的极大增强将进一步促进业务创新,运营商的业务发展重心将进入以2B为主、2C和2H持续发展的阶段。由于快速发展的行业2B业务具有多样性和差异化诉求,要求网络持续提升自动化与智能化能力,运营商对自智网络的诉求空前强烈。自智网络产业发展将出现以下几个趋势。

◆ 内生智能将取得突破性进展,内生智能网络实现规模化部署,自智网络实现终身自学习。基于内生智能的网络功能和网络运维将全面部署商用,通信网络实现跨自治域自适应闭环。

◆ 人机关系将持续加强并彻底发生改变,由早期“以人主导”走向“机器主导+人辅助”,人机成为“队友”,最后迈向人机共生,人类与机器相互学习。

◆ 在标准方面,自智网络的L5标准趋于成熟。

◆ 全产业自智网络向L5逼近。

展望未来,通信网络作为电信运营商的基础生产力,构建自智网络、迈向超自动化已成为运营商抓住万物智联时代发展红利的必然选择。然而,通向自智网络将是一个长期的旅程,是电信行业的“诗和远方”,需要产业各方共同努力,坚定前行。华为愿和全行业伙伴一起,构建开放生态,打造“自动、自愈、自优、自治”的自动驾驶网络,加速迈向立体超宽、确定性体验、智能原生、绿色低碳的通信网络。

参考文献

[1] TM Forum. Autonomous networks: business and operational drivers[R/OL]. (2021-05-06) [2022-09-15].

[2] GSMA. The mobile economy 2022[R/OL]. (2020-02-28) [2022-07-14].

[3] Ericsson. Our latest 5G business potential report: set your compass now[R/OL]. (2019-10-15) [2022-09-15].

[4] 陈晓晟. 运营商5G to B市场超六千亿美金 “冲锋号”已经吹响[N/OL]. 澎湃网, (2020-10-30) [2022-09-15].

[5] European Commission. Shapping Europe's Digital Future.[R/OL]. (2020-02-19) [2022-09-15].

[6] TM Forum. Autonomous networks:empowering digital transformation-from strategy to implementation[R/OL]. (2021-09-20) [2022-09-15].

[7] PARASURAMAN R, SHERIDAN T B,WICKENS C D. A model for types and levels of human interaction with automation[J]. IEEE Transactions on Systems, Man, and Cybemetrics-Part A: Systems and Humans, 2000, 33(3): 286-297.

[8] TM Forum. Autonomous networks business requirements and framework[R/OL]. (2021-11-22) [2022-09-15]. IG1218.

[1].  TM Forum是一个非营利的数字经济领域的国际行业协会,是拥有来自超过180个国家的900多家顶级运营商、设备商、系统集成商和咨询公司等机构的全球性联盟。TM Forum致力于帮助电信运营商和行业各方合作伙伴实现数字化转型及商业成功,为会员提供框架和标准、最佳实践、工具、研究报告、会议、培训认证等服务。

[2].  自治域是定义自治范围的管理域。它是实现特定网络操作自动闭环的基本单元,通过使用闭环控制机制实现自我管理。

相关图书

AIGC从入门到实战:ChatGPT+Midjourney+Stable Diffusion+行业应用
AIGC从入门到实战:ChatGPT+Midjourney+Stable Diffusion+行业应用
智能驾驶之激光雷达算法详解
智能驾驶之激光雷达算法详解
低代码打造RPA——Power Automate Desktop基础实战
低代码打造RPA——Power Automate Desktop基础实战
场景创新:SAP与初创企业的数字化转型联合创新实践
场景创新:SAP与初创企业的数字化转型联合创新实践
数据驱动的智能驾驶
数据驱动的智能驾驶
元宇宙漫游
元宇宙漫游

相关文章

相关课程