企业数字化转型人工智能技术落地指南

978-7-115-60266-4
作者: 金玮
译者:
编辑: 秦健

图书目录:

详情

本书首先从企业支持人工智能技术发展的视角出发,讲解如何认识数字化转型、数字化转型战略主要包含的方面、支持数字化转型的应用体系设计方法等。其次,承接对应用体系设计的讨论,详细讲解如何研发并落地实施定制化的人工智能应用,内容包括对人工智能应用研发的整体认识,业务需求和业务知识的梳理,数据收集、数据处理与建模分析,模型上线运行和持续迭代等。最后,基于相关讨论,分析人工智能应用研发的特点,探讨人工智能领域在应用研发模式与策略、专业技能人才培养等方面可能产生的一些新变化,以及领域内各种业态可能出现的发展趋势。 本书适合企业技术总监、规划与计划人员、人工智能应用研发管理者与研发技术人员,以及对企业数字化转型和人工智能技术落地感兴趣的读者阅读。

图书摘要

版权信息

书名:企业数字化转型人工智能技术落地指南

ISBN:978-7-115-60266-4

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。



著    金 玮

责任编辑 秦 健

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315


本书首先从企业支持人工智能技术发展的视角出发,讲解如何认识数字化转型、数字化转型战略主要包含的方面、支持数字化转型的应用体系设计方法等。其次,承接对应用体系设计的讨论,详细讲解如何研发并落地实施定制化的人工智能应用,内容包括对人工智能应用研发的整体认识,业务需求和业务知识的梳理,数据收集、数据处理与建模分析,模型上线运行和持续迭代等。最后,基于相关讨论,分析人工智能应用研发的特点,探讨人工智能领域在应用研发模式与策略、专业技能人才培养等方面可能产生的一些新变化,以及领域内各种业态可能出现的发展趋势。

本书适合企业技术总监、规划与计划人员、人工智能应用研发管理者与研发技术人员,以及对企业数字化转型和人工智能技术落地感兴趣的读者阅读。


数字化转型是实现企业乃至社会提质增效的一项重要手段,特别是对于某些市场较为成熟且高度自由竞争的行业。实现数字化转型,可以理解为培养一种运用数据实现价值重塑的能力,这种能力的培养离不开数据、组织与业务的变革,而这些变革则依赖于各种先进的信息技术。其中,人工智能技术是助力数字化转型潜力最大的技术之一,随着政府与企业应用人工智能技术并在越来越多的场景下取得良好成果,人工智能技术逐渐得到越来越多的社会关注,并被看作实现数字化转型的重要依托。

各行各业在积极尝试应用人工智能技术助力数字化转型的同时,实际上也在逐渐建立对人工智能技术的正确认识,积累人工智能技术落地的成功经验。许多先行者已经发现,尽管人工智能技术具有较好的应用潜力,但并不是单纯运用先进的分析模型便能取得好的实际效果,也并不是直接将别处做好的模型拿来部署上线便能取得立竿见影的效益。由于人工智能技术的特殊性,运用人工智能技术实现业务革新与企业转型,对思想认识、基础条件、技术能力乃至行业认知等方面均提出了较高要求,其中包含许多需要注意的问题和技巧。

本书尝试综合讨论在开展企业数字化转型相关工作的过程中,如何制定令人工智能技术得以有效助力数字化转型的相关战略,如何设计并建设一套能够支撑数字化转型且将人工智能技术融入企业现有业务的应用体系,如何完成人工智能应用研发与落地,并尝试基于讨论的结果,分析人工智能领域可能的发展方向。尽管人工智能技术已经积累了较多成功的应用案例,但人们对人工智能技术的讨论主要集中在理论模型、发展历史及现状、应用场景与成功案例等方面,对战略设计、技术落地等方面的详细讨论较少。因此,本书的内容或许可以为人工智能领域贡献一些新思想与新观点。

本书主要面向的读者是开展人工智能技术研发工作的中层、基层管理者,但其中的各部分内容也可供实现人工智能应用研发与落地的技术工作者、项目管理者乃至企业管理者参考。尽管书中各章内容编排呈现出比较明显的递进结构,但各章内容没有强烈的耦合或依赖关系,读者可根据需要优先阅读自己更为重视或感兴趣的部分。根据本书的编写目的和预期读者,本书仅在少数情况下对某些技术细节进行描述,用以辅助文中思想表达及观点讨论。此外,可能需要读者注意的是,本书大部分内容是从希望运用人工智能技术实现业务提升的企业或组织的角度出发,而不是从提供人工智能技术研发或通用应用服务的项目组或技术服务商的角度出发编写的。不过,技术团队可能反而因此受益,因为视角的转换可能会令其更好地理解自己服务的对象并采取更有利的策略与行动。

本书共7章。

第1章主要探讨有助于全面理解数字化转型的各种话题,以及数字化转型与人工智能技术的密切联系。

第2章~第6章分别从战略、应用体系、应用点3个层次详细探讨以助力数字化转型为目标的人工智能技术落地的思路、过程、具体举措和重点问题。其中,第2章主要讨论能够促进人工智能技术成功落地并助力数字化转型的各种战略;第3章主要讨论设计与建设支撑数字化转型的应用体系的思路与方法;第4章~第6章主要讨论研发一款人工智能技术应用并将之落地所涉及的业务需求与业务知识收集、数据收集、建模分析、部署上线等工作的流程和技巧。

基于前6章的讨论,第7章分析人工智能领域在研发与管理方式、人才培养方式、技术服务业态等方面的发展趋势。

本书以理论探讨作为重点,对于大部分观点,都会进行比较清晰的理论分析;对于大部分现象,都会给出比较合理的解释。本书尝试在表达观点时尽量精练且逻辑严密,确保全书的逻辑性。

我所在的单位是一家以油气行业信息技术服务为主营业务的国有企业,由于油气行业的业务链条长、应用场景丰富、与业务知识结合紧密,而且领域内企业正响应国家号召,大力推进数字化转型等,在油气行业开展人工智能技术应用等相关工作,可以积累参考意义较大、适用范围较广的实践经验。根据不同场合下领导、同事的教育与指导,以及数年从顶层设计到落地实施等工作中积累的实践经验,我形成了一套比较系统的思想并将它付诸笔端。为了保证在解读某些事件时足够客观、全面,在运用某些专业知识时足够正确、严谨,减少因表述带来的偏见或误解,本书没有代入实际案例,这一点还请读者谅解。

由于写作水平有限,书中难免出现一些疏漏之处,恳请读者批评指正。如果本书能够对个人、企业乃至社会提供些许帮助,我会感到非常欣喜。

在本书的编写过程中,感谢单位给予的支持,感谢令我的才能得到培养与展现的领导和同事,没有你们的帮助,这本书不可能出版。

金 玮


本书由异步社区出品,社区(https://www.epubit.com)为您提供相关资源和后续服务。

作者、译者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎您将发现的问题反馈给我们,帮助我们提升图书的质量。

当您发现错误时,请登录异步社区,按书名搜索,进入本书页面,单击“发表勘误”,输入错误信息,单击“提交勘误”按钮即可,如下图所示。本书的作者和编辑会对您提交的错误信息进行审核,确认并接受后,您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。

扫描下方二维码,您将会在异步社区微信服务号中看到本书信息及相关的服务提示。

我们的联系邮箱是contact@epubit.com.cn。

如果您对本书有任何疑问或建议,请您发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。

如果您有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区投稿(直接访问www.epubit.com/contribute即可)。

如果您所在的学校、培训机构或企业想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。

如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接通过邮件发送给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。

“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https://www.epubit.com。

“异步图书”是由异步社区编辑团队策划出版的精品IT图书的品牌,依托于人民邮电出版社几十年的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的LOGO。异步图书的出版领域包括软件开发、大数据、人工智能、测试、前端、网络技术等。

异步社区

微信服务号


数字化转型是当前企业和社会越来越关注的话题。人们从不同角度提出了对数字化转型的理解和开展相关工作的一系列原则。企业也逐渐开始制定数字化转型相关工作的实施方案。要实现数字化转型,除需要高瞻远瞩的顶层设计以外,还需要逐一发现适宜开展数字化转型的各种场景,以及实现数据、组织管理、业务、技术等要素的共同支持。

在技术方面,数字化转型和人工智能技术的结合显得自然而有必要:就数字化转型而言,在当前的许多场景中需要数据挖掘能力较强、研发成果智能化水平较高的人工智能技术,而人工智能技术只有被赋予支撑数字化转型这一意义,才能充分发挥其作用。本章主要讨论有关准确认识数字化转型的各项问题,并讨论人工智能与数字化转型的关系。

在数字化之前,人们常提到的相近概念是信息化。信息化是指面向某一场景或某一任务,利用信息技术对现实世界中的对象进行描述和处理。例如,实体文件的电子化、企业办公的自动化,便分别主要指运用信息系统存储已有的台账、票据、日报信息,以及利用互联网实现企业办公流程事务的线上办理。信息化主要涉及对数据的存储、管理、查询、展示,以及部分自动化处理。我国企业和社会的信息化进程一般被认为开始于20世纪80年代,经历数十年的发展,绝大部分企事业单位和政府机关在一定程度上实现了信息化,办公自动化(Office Automation,OA)系统、企业资源计划(Enterprise Resource Planning,ERP)系统、监控与数据采集系统等典型信息化应用深入各行各业并为人所熟知。

数字化从字面上来看似乎是信息化的一种新形式,但实际上其概念与信息化有着显著区别。数字化的含义是令数据具备助力价值提升的能力。一切利用数据增进感知、提炼知识,最终带来业务价值的应用都可以看作数字化的表现形式,这个概念强调在对数据进行处理、分析、可视化等操作时带有产生效益的主观目的。数字化转型在数字化的基础上追加了“转型”这一具有自我革新意味的概念,无论是理解为“运用数字化实现转型”还是“在数字化这一方面实现转型”,都表示自身需要具有利用数据产生价值的能力,无论是提升企业内部效益,还是帮助企业形成更加满足市场需求的产品。实现数字化转型,意味着数据能够全面支持企业内部价值活动所形成的价值链。

数字化转型的核心关注点是实现价值提升,但数字化转型相关举措并不全都与数据直接相关,实现价值提升这一行动本身也并不是一个一次性的过程,而是一个持续开展、不断完善的过程,因此用“具备助力价值提升的能力”可能比“实现价值”更贴切,即数字化要求有能力不断创造更优质的条件,持续利用数据带来新的价值。数字化和数字化转型的概念清楚地表达了数字化不是信息化。数字化转型也不仅是开发一两个应用、建设一两个系统——这些是支撑数字化转型的具体行动,而不是数字化转型本身,是手段而非目的,特别是不能以完成任务指标的心态开展数字化转型,或者说为了数字化转型而数字化转型。数字化转型检验着人们对提质增效的主观意愿,只要人们愿意持续在各个场景思考运用数据支撑业务提升的方式,并采取举措将之落实,数字化转型便能够不断为企业带来全方位的提升,在企业的业务模式、运行效率、管理水平、决策能力等方面发挥显著作用。

另一个需要辨析的是数字化与智能化的联系。智能化的含义是让各种业务活动具备智能属性,侧重于技术角度的提升。对数字化转型而言,智能化是数字化转型的重要技术支撑,而非数字化转型的全部意义;对智能化而言,它能在提升个人生活体验、社会运行效率等其他方面发挥作用,而非完全服务于数字化转型。人们时常将数字化、智能化同时提出,这是因为两者各有侧重又相互补充:数字化在界定上侧重于思想观念的转变,而智能化则侧重于技术的升级;数字化在结果上与智能化相同,同时关注效益和体验。信息化、数字化、智能化3个概念的含义比较可参考表1-1。

表1-1 信息化、数字化、智能化简要比较

概念

含义

核心关切

信息化

利用信息技术对现实世界中的对象进行描述和处理

实现数据的电子化存储、传输、处理等操作

智能化

让各种业务活动具备智能属性

运用使业务具备智能属性的新技术手段,实现效益或体验提升

数字化

令数据具备助力价值提升的能力

综合运用各种能够挖掘数据价值的手段并为此创造各种条件,实现效益或体验提升

在谈论数字化转型时,人们有时会对数字化转型举措的界定感到疑惑,在此对这个问题进行一些讨论。数字化是一种更有利于实现效益提升和价值创造的状态,实现数字化转型的最终目的也是实现价值的产出。数字化是各种提质增效举措中的一类,它围绕数据而展开。提质增效的行动未必全是数字化的,毕竟与提质增效相关的思想和行动远远早于数字化产生,但目前为了提质增效所采取的各种行动常与数字化有关,这些行动不仅包括通过数据实现价值,也包括为实现数字化创造条件。用比较严格的标准来衡量,组织采取的一些措施并未包含这两类行动,也就未必是为了数字化转型或有助于数字化转型;而一些措施可能包含这两类行动,但它们并不是全部或主要部分,其最终目的也未必是价值提升。对于这两类实际上不属于或仅部分属于数字化转型的措施,如果不加以甄别,就可能错误地认为以提质增效为目的的各种行动都可归为数字化转型,进而产生“新瓶装旧酒”的疑惑。不过,如果发自内心地希望实现转型升级与价值提升,而非出于某些目的牵强附会,那么无须特意分辨、强调哪些行动是“数字化”的,只需要以这种思想观念指导行动即可。

由于数字化对企业提质增效的促进,企业在数字化转型上的领先会带来竞争优势,因此,企业可能在数字化转型方面展开新一轮的长期竞争。数字化转型方面的竞争至少包含“有想法”“有能力”“有行动”3个层面,如图1-1所示,即对数字化转型的思想认识和开展工作的战略规划与顶层设计,支撑数字化转型的资金、人才资源、政策和信息技术能力,以及实现数字化转型相关应用研发和落地的执行力和执行效率。数字化转型也正是在这3个层面不断深入,在越来越高的水平上助力社会和企业的价值提升。

图1-1 数字化转型的3个层面

回顾近些年企业及企业信息技术能力的发展历程可以发现,率先开展数字化转型工作的企业往往具有较高的信息技术能力和信息化水平。前者是因为大数据、人工智能等技术的应用实现了对数据的进一步挖掘,令人们意识到数据在价值提升上的巨大潜力,转变了人们看待数据的观念,进一步形成了围绕通过数据分析实现效益产出这一核心关切的数字化转型。后者是因为尽管完成思想认知的转变、具备先进的数据挖掘技术,但也要有相应的数据基础才能让数据产出价值,这受到企业当前信息化水平的影响。可以说,数字化转型是对企业信息化水平的一次大考,将会充分暴露企业此前的信息化水平特别是数据采集和管理方面的各种问题。一些企业可能对之前投入巨大人力、物力建设的信息系统充满信心,直到开展数字化转型工作时才认识到自身在信息化层面还面临着许多根本性的问题。

为了表明进一步讨论数字化转型涉及的方面等其他话题的价值,我们首先需要分析数据和数字化转型的重要性。数据是对场景与对象的定量描述,当各种场景与对象能够被量化时,对完成与其相关的描述、分析、处理、评价等工作便可能实现较高水平的标准化和自动化,对实现挖掘规律、预测趋势、指导行动等目标便可能形成新的抓手和方法。积累的数据越重要、完整、丰富,所能对当前场景或对象的刻画能力越强,对其分析、处理所可能产出的价值便会越高。

数据的重要意义也与信息技术密不可分。尽管数据具备实现价值的潜力,但这未必能保证价值的大量产出,因为价值的产出不仅依赖于分析手段,也依赖于计算能力。人工计算的效率低下曾经是数据产出价值的重要障碍,由于业务需求的变化与发展,人们希望处理的任务和服务的对象逐渐增多,人的处理能力和处理效率便相对显得越来越有限,单纯依赖人工越来越难以支撑相应任务的完成。与此相对,随着信息技术的显著发展,计算机在遵循固定规则对数据自动化处理方面的效率远超过人,错误更少且成本大幅降低。因而,人们开始越来越广泛地尝试运用信息技术,特别是利用其对大规模数据的高效处理能力完成各种任务,这些尝试取得了良好的效果。

可以说,信息技术的发展逐渐满足人们对数据分析、处理的各项需求,支撑着人们运用数据寻找规律、指导行动的灵感与创意的实现,让数据的价值潜力得以彰显,也让数据的重要性得以被人们正确认识。信息技术的发展也间接推动着数据质量的提高,随着数据价值被广泛认可、数据价值成功挖掘案例逐渐增多,许多人在面向自身组织开展相似的数据价值挖掘活动时,才发现自身存在的数据质量问题。如图1-2所示,数据质量和信息技术水平共同决定数据价值挖掘的效果,如果希望充分挖掘数据的价值,便应同时在提高数据质量和信息技术水平上进行努力。

由于数据的重大价值潜力,数字化转型的重要性也得以凸显。数字化转型的重要性以其带来的价值作为证明,该价值一般表现为对现有业务价值的提升,其实现方式往往为运用数据评估现状、预测未来、指导行动,实现对劳动效率或决策质量的优化。用数据实现价值的行为此前并非不存在,例如利用统计方法挖掘规律、利用可视化展现当前状态等,只是在数字化转型这一概念产生前,这种价值产出的方式是孤立的、不系统的,而且人们不太可能有意识地为其准备良好的数据,更不太可能创造充分的组织与政策条件。但是,当运用数据分析可能产生的价值量和价值占比不断增大时,人们便可能需要专门创造条件,让数据能够指导各种各样行动的开展。

图1-2 数据质量和信息技术水平共同决定 数据价值挖掘的效果[1]

[1] 数据质量和信息技术水平均对价值产出有影响,数据质量越高,可供挖掘的价值越多,信息技术水平越高,对数据的价值挖掘能力越高。

目前,随着许多企业的业务及市场逐渐成熟,运用数据实现提质增效,指导生产、经营、销售等业务活动便成为一种非常重要的持续强化自身竞争力的手段,因为这时业内企业可能已然无法在技术、渠道等其他方面拉开显著差距,企业在本业务领域的增长更加需要朝向内部进行努力,如提升生产率、降低生产成本等。对这些企业而言,数字化转型变得尤为重要,越早开展相关行动,便越有可能保持自身竞争地位。对于某些新兴行业,或许仍然应该以探索业务模式、占据市场、提升技术实力等工作优先,但如果能够结合数字化的思想开展业务活动,便可能更快享受其带来的效益,并减少日后在组织管理、业务流程等方面进行重塑的工作量,尽管这是随企业业务发展、规模扩大、提质增效需求而在所难免的事情。

数字化转型直接关注业务、数据与技术,三者的意义及所涉及范围如表1-2所示。

表1-2 业务、数据、技术的意义及所涉及范围

对象

意义

涉及范围

业务

令数据实现价值的场景

降低成本
提升效率
支持决策
新产品、新服务
组织与流程变革
……

数据

可挖掘业务价值的来源

数据统一
数据标准化
数据安全保障
数据处理能力
……

技术

实现价值产出的工具

云计算
大数据
人工智能
物联网
边缘计算
……

数字化转型围绕价值产出,首先关注业务。这里的业务是指数据可能实现价值产出的机会,即数据可能在何种场景、以何种形式实现价值,它们确定数字化转型的直接工作对象和工作目标,这些机会既包括对内的,如提升事务性流程的效率、丰富支持参考决策的辅助信息,也包括对外的,如实现业务工作降本增效、形成新的产品与服务。

运用数据实现价值,本质上是从数据中提炼有价值的信息与知识规律,以解释过去、辅助当下、指导未来。只有活用各种方法做到这一点,才能令所做的各种工作带有数字化转型的意义。在其他方面所完成的各种工作,都可以在某种程度上看作为数字化转型创造条件,如果没能运用数据实现价值,那么无论是平台建设还是组织变革,都不能认为成功地支撑了数字化转型,尽管它们可能从另外的方面带来了效益。运用数据分析、建模及可视化技术实现的消费者分析、供应链管理、物流管理、预测性维护等功能是典型的运用数据实现价值的例子。在这方面,人们需要不断完善思想理论、丰富方法手段、探寻灵感创意,寻找更多可能令数据带来价值的场景,明确各个场景下可以开展的数据分析与挖掘工作,并使之实现越来越高的价值产出。

运用数据实现业务提升,不仅可以通过尝试对每个单独的业务场景进行提升,而且可以通过从宏观的管理运营模式上实现创新。例如,实现企业所提供各类产品的软硬件联动、实现各级产品的整合形成综合解决方案、实现服务提供方式从项目化向平台化的转变等。这种层面的工作更加接近于人们认知上的转型,涉及组织、业务等方面的深度变革,相比单纯研发某些应用或功能模块,此时管理层面的战略规划与执行相对重要得多,不太可能仅凭数字化理念和配套技术实现,后两者主要在此间发挥支撑作用。尽管如此,新理念、新技术可能会先于管理行动,以其成果为管理决策提供参考并支持相应行动的开展。

在业务之后,数字化转型直接关注的是数据。数字化转型工作的有效开展存在着许多前提条件,为了满足这些条件而需要采取的行动也应归于数字化转型工作的范畴,当然这些行动可能同时会在其他方面带来积极影响。从各种功能落地实现的角度,数据保障是较为重要的一项工作。只有高质量的数据,才能支撑各种从数据中挖掘知识、实现价值的设想;只有高效的数据处理能力,才能实现用以实现价值提升的各种数据服务的大范围对外提供。数据质量的提升,意味着需要对数据进行更好的管理,令数据的使用者能够便捷、高效地获取正确的数据,这要求减少数据散落存储、数据格式不统一、数据不准确、数据权限不合理等问题,也要求根据业务需求对数据组织方式、数据管理方式进行细致的调整,还要求具备强大的数据访问、获取、处理、存储等能力。

单从数据本身的角度,为了实现上述目标,需要理念和方法的共同支持。理念上,需要建立系统的数据管理观念,这一点上方法论不一而足,但其根本是对数据如何实现价值、在实现价值前必须满足何种前提条件有深刻的认识,并据此采取各种方法和运用各种技术。方法上,主要包括从采集、存储和使用上逐一实现统一规范,业务组织承担数据建设责任,实现不同来源数据的联结与汇聚,针对不同数据的需求频率制定存储与访问方式,制定多级数据安全体系等。

数字化转型同时直接关注技术。随着数据价值产出需求愈加凸显,支持对海量数据进行高效处理及深度知识挖掘的各种技术也在不断发展,其中云计算、大数据、人工智能、物联网、边缘计算等方面的技术成为人们实现数据管理和价值产出的主要依托,这些技术的含义分别如下。

云计算指以远程、可扩展的方式提供计算服务。云计算通过网络将不同的计算资源形成一个称为“云”的虚拟汇聚,而应用则根据需求从“云”上取用相应计算资源并提供服务。在云计算领域里,计算资源成为一个按量付费的商品,软件在基于云对外提供服务时也可以不考虑硬件特性并可随时扩展计算能力。云计算的技术主要包括虚拟化、分布式计算、负载均衡、平台/软件及服务等。

大数据技术指实现对单机无法处理的海量数据的采集、计算、存储等支持。大数据技术主要基于分布式的思想,即将各类数据处理任务分配至多台计算设备,各种功能组件分别完成不同类型数据的不同处理任务。除此之外,数据治理方面的各类功能如数据质量管理、元数据管理等一般也可归为大数据技术。

人工智能指由人创造的具备较高智能水平、能对环境变化进行灵活应对的系统。人工智能最原始的形式是规则系统,目前一般被认为需要从数据中提炼知识与规律,以实现对新的信息输入的处理,所包含的技术主要是各类数据分析模型,目前统称为机器学习。

物联网是利用信息传感技术,将设备与网络连接。物联网实现了各类设备的互联,当设备的运行数据联网后,可以实现识别、定位对象以及情况查看、远程控制等功能。物联网技术主要涉及设备信息获取、传输与智能处理等方面,典型应用包括智能家具、智能电网、智能交通等。

边缘计算是指将数据处理与分析任务放在终端设备完成。边缘计算主要用于完成某些实时性要求较高的任务,在这些任务中,如果将数据传回数据中心或云平台进行处理,可能导致显著影响业务效果或用户体验的延迟问题。边缘计算主要涉及计算硬件、搭载计算能力和分析模型的数据采集设备,为了适应边缘端的计算,分析模型的轻量化也是其研究课题之一。

除上述技术以外,支撑数字化转型的技术还包括区块链、数字孪生、网络安全等。这些技术一般会被综合运用以解决各种实际问题。随着各种技术的蓬勃发展,实现不同技术的融合已然成为数字化转型的一项重要且技巧性较高的工作,特别是这些技术来自不同技术服务商。在运用各种技术时,应根据业务需求选择技术而非将技术硬搬进业务场景,让各种技术一同形成对业务完整连贯的支撑。同时,还需要考虑价值产出和可行性,优先在需求急迫、价值高、实现周期短且技术可行性强的场景开展工作。

延伸讨论:技术与业务的相互促进

尽管各种技术都是用来服务业务的,但业务与技术并非完全由一方牵引另一方,两者的相对关系取决于业务需求的涌现与技术能力的提升的先后关系。如果新技术先产生,那么业务人员可能会主动寻找技术的应用场景、活用技术来改善当前的业务;而如果新业务需求先产生,那么技术人员可能会为了适应业务需求发展,围绕某些目标对技术进行改良或革新。如果业务(包括管理)方面有能力指引科技发展,它们可以走到台前,而如果暂时没有足够的把握,则可能需要技术的发展和落地探索实践为其提供更多信息、促进其思路整理和方针制定。

技术和业务的发展并不同步,某些业务功能受限于技术的发展而不能实现理想的效果,某些技术因为缺乏应用场景或依赖其他尚未成熟的技术而无法真正发挥作用。尽管如此,不可轻视业务的打磨和技术的积累,两条线上的工作都需要持续投入人力与时间进行探索与实践。一些看上去是在单方面做无用功的事情,或许在具备某些条件时能够迅速显现其意义。

企业在对利用数据实现价值寄予厚望的同时,也逐渐发现为了实现这一目标将会面临的种种困难,对业务繁多、规模庞大的企业而言,这一点表现得尤为明显。这些困难往往并不仅仅源于数字化转型直接涉及的业务设计、数据重塑和技术提升任务,也可能来自各种基础条件的保障。开展数字化转型必需的基础条件包括思想认识、发展政策、人才、资源投入等,其具体包含的内容如图1-3所示。尽管这些基础条件并不是开展数字化转型首先想到的,却很容易影响数字化转型的进程。

图1-3 数字化转型的4项必需基础条件

首先是思想认识。实现数字化转型,最重要的是从高层领导、中层干部到基层员工都有开展数字化转型相关工作的主观意愿,以保证从规划、计划到落实、执行都能保持思想活力和工作动力。一种比较理想的状况是,各级领导和员工能够分别从自己的实际工作和理解出发,尽自身所能出谋划策,站在企业长远发展的角度,客观、中立地审视各种建议和实施方案,以积极、友善的态度提出建议,最终基于一个完善的顶层设计统筹推进数字化转型,并在各自的岗位上履职尽责,齐心协力实现共同规划的蓝图。

为了实现这个目标,从思想认识上:一是要正确认识数字化转型的必然性和深远意义,尽快做好面对新形势、新趋势、新问题的准备;二是要克服畏难情绪,在方法指导、资源支持等方面排除“等、靠、要”的心态,主动求新、求变,寻找运用数据实现提质增效的途径并积极行动;三是要有大局意识、合作意识,要围绕企业发展大局设定自身发展目标,积极与其他部门、其他企业合作,排除本位主义,让各种资源能被投入最迫切需要的、价值回报最大的位置;四是要有学习意识、共享意识,各级组织需要主动开展新思想、新方法、新技术的学习,实现知识、经验、思路的相互分享,促进组织能力持续提升。

其次是发展政策。政策是重要的行动保障。为了让各级员工对数字化转型有正确的认识、采取积极的行动,不能仅靠宣传口号,而更需要明确给出有利于数字化转型工作开展与深化的政策,并将之严格落实。有利政策的实际制定能让人确信政策制定者(一般是企业管理者)的意志,能在物质和精神上对相关工作人员实现双重激励。只有口号而没有实际举措,部分率先行动的个人或组织会因众多掣肘而倍感经营艰辛,最终无法长期坚持,其他人或组织则因为看不到实际利益,怀疑政策制定者的实际支持意愿,特别是眼见先行者付出心血却没取得成果后,更易萌生退意,最终令相关工作难以继续推行。

支持数字化转型的政策应主要围绕为数据的价值产出创造有利条件。这些条件可以分为两方面。一方面,让人得以持续提升自身能力并自主开展创新创造活动,这包括建立组织内培训及知识共享组织与机制,提供得以开展数据分析等价值创造活动必需的数据权限、计算资源乃至经费,完善对外合作渠道及产学研用协同机制,以及适度降低上述活动的间接成本,如审批流程与周期、科研经费执行与成果管理要求等。另一方面,让人有意愿参与相应的价值创造活动,这包括从经济待遇及荣誉上进行鼓励,对研究成果的价值化提供市场渠道支持、计量价值产出并与个人发展挂钩,建设研究创造环境和人才选拔机制等。

在制定政策时,要注意政策的综合运用,要把指导意见落地到实施举措与行动计划上。如果鼓励各级组织开展数字化转型,应为任何希望开展数字化转型工作的组织就其计划开展的具体工作提供业务与技术咨询。对于评估后认为可行性与价值较高的工作,应协调来自其他部门的必要资源,降低相关流程及行政事务造成的精力与时间折损,放宽对某些具有远期价值产出前景的成果的当期效益的评估和考核,同时形成的成果能够被认定为组织和个人荣誉,产出效益能从经济上惠及参与相关建设工作的所有组织和个人。类似地,对多部门协作、知识共享等方面的促进,也应给出相应的政策保证。

然后是人才。这里主要指具有稀缺性乃至不可或缺的人才而非人力。实现数字化转型是对企业进行重塑,涉及战略、业务、技术等方面。例如,战略上,基于企业现状、竞争环境、技术动态与市场发展趋势,从业务模式、组织结构、产品研发、市场营销等方面为企业制定合适的发展战略;业务上,审视整个业务流程以及涉及的对象和行动,精准发现当前的业务痛点以及深层次原因,从业务视角提出合适的整体解决方案;技术上,综合运用各种技术,为提出的业务需求寻找合适的技术实现,在某些重要业务需求的影响下,有可能需要调整企业的技术架构。

为了满足这些方面的高层次需求,数字化转型涉及的每个方面都需要一批优秀的人才进行方案设计及执行过程质量控制,战略上要求有优秀的企业管理者,业务上要求有来自各业务线的、对业务有全面宏观理解和丰富一线经验的业务专家,技术上要求有来自不同技术领域的技术专家,他们能够全面把握业务需求,将之转换为技术目标并对研发过程提供不间断指导,而且能根据当前的企业业务发展需求全面设计和调整技术架构。这批优秀的人才决定企业数字化转型的成功。当然,支撑这批人才展现才能与智慧的不同层次的业务与技术人员也必不可少,如果欠缺将所绘制的蓝图实现的力量,有关数字化转型的各项设计便难以落地。为了满足数字化转型的人才保障,企业可能需要投入较多资源从内部寻找或从外部聘用相应人才,并在薪资、政策、能力展现空间等方面提供充分的保障,使其长期稳定为企业提供服务。

最后是资源投入。资源投入是企业实现数字化转型的根本保障,这里以资金、时间和人员(精力)为主。在数字化转型工作所需的资源中,首先需要的是资金。为了实现数字化转型,企业需要进行业务设计和平台与应用研发、执行鼓励开展数字化转型工作的政策、维护一支服务于数字化转型的技术团队等,在这些方面需要的开支如设备的采购、团队的维持等,一般都可以折算成资金。

除资金以外,还有一些难以用金钱量化的资源。一类是重要人员的精力。开展数字化转型工作会花费大量优秀人才乃至企业管理层的精力与时间,这些重要人员往往具有一定程度的不可替代性。有时,这表示他们不得不为此将精力从现有的管理、业务或研发工作中抽离,当重要人员的精力无法兼顾时,便有可能对企业的整体发展造成影响,例如无法有效控制产品研发进度、难以高质量制定战略规划等。另一类是行政权力。与数字化转型有关的组织调整、业务重塑或产品研发等方案的落实可能需要多方协调,例如部门撤并、业务变更、数据开放、市场联动等,如果没有高层领导的密切关注与高度支持,某些组织或部门可能因为无法明确自身的定位与职责、无法明确相应工作的合适开展方式、担心自身利益受到影响、担心产生若干合规性问题或担心与其他组织或部门产生矛盾和摩擦,致使其不得不或有意地停止相关工作的开展。如果企业在某些问题上长期莫衷一是乃至相互掣肘,无法有效达成共识并协作解决,将会使相关团队空耗精力,进而导致数字化转型长期无法从实质上推进。

后两类资源在企业内的竞争性(排他性)更强,相关的投入考验领导的胆识与魄力。这并不是说企业领导应该无条件全力支持开展数字化转型工作,而是说企业领导应审慎地选择开展(分步开展)数字化转型工作的时机与策略,而到真正采取行动时则应保持足够强大的决心和坚定的信心。

开展数字化转型涉及的步骤可大体按阶段划分为制定转型战略、梳理工作任务、执行工作计划。这种制定目标、梳理任务、执行落实的思路被普遍地运用在各种生活和工作场景,只是因为数字化转型工作意义相对重大,影响相对深远,涉及的要素繁多,所以制定全面的战略并整体推进对筹划能力提出了较高的要求。基于这种困难,有时人们提出的数字化转型战略会显得零散或只注重局部,但实际上越宏大的任务,越需要精细规划。在此,仅就几个步骤内需要特别考虑的部分内容进行描述,其中的许多细节将在第2章和第3章中进一步讨论。

首先是制定转型战略。在开展具体的数字化转型工作前,要确定数字化转型的战略。这里主要指目标和实现路线,具体包括在每个时间节点内,会围绕哪些目标或在哪些场景及业务线上开展工作、所开展工作特别是研发与建设工作的大体内容、投入的人员与费用以及预期效果等。最终,这部分可能与企业整体的发展战略相互作用,提出或影响企业发展战略中关于宏观组织结构、技术架构、业务体系变革演进的设计。

开展这部分工作时:一是要与企业整体的发展战略相适应,企业将哪些工作(优化某项业务营收、提升职能部门效率、改善员工工作体验等)放在比较优先的位置,数字化转型也应优先围绕相应工作来开展;二是要与当前所拥有的基础条件相适应。政策、人才、资金乃至行政权力,都会影响数字化转型最终成效,因此需要根据这些资源制定数字化转型的具体目标。在明确数字化转型战略的过程中,也要逐渐对当前数字化转型工作形成正确的效果预期,其中包括当前数字化转型能做到什么及为此需要的配套支持、不能做到什么及造成这一结果的原因。预期的正确形成有利于得到支持和认可,令相关决策者放心地提供各种所需资源,不提出过高要求或形成过高预期,让数字化转型工作开展得更为顺利和健康:取得充分的资源做出真实、有意义的成绩,而不是由于资源条件处处受限而被迫做些浮夸的表面文章。

其次是梳理工作任务。梳理工作任务指充分实现数字化转型涉及的思想宣贯、政策保障、组织调整、业务重塑、管理变革、技术实现等配套工作的具体落实方式。不过,在提到数字化转型时,人们可能会更多地联想到支撑数字化转型的相关技术实现,即技术平台、智能应用等,除社会约定俗成的表达习惯以外,部分原因是相关技术实现与数字化有更为紧密的联系。

从技术实现角度,数字化转型的主要工作包括建设数字技术平台与应用体系两方面,需要首先梳理现有数据流和业务流、了解当前痛点和需求,以及调研现有的信息化水平,包括采集设备、现有信息系统及支持功能、数据基础、算力基础等。这能够为建设需求和可复用的现有资源提供更多的参考依据,也将成为数字化转型工作中可行性论证及方案设计的重要组成部分。随后,需要根据调研结果制定一套完整的建设方案,包括计划解决的问题、整体技术方案、所含技术组件和应用点、整体预算(包括软硬件及服务采购、内部及外协人员投入等)、建设周期和进度计划、预期效果等。建设方案一般应与此前的调研结果紧密关联,以令方案思路清晰,体现方案的合理性。

最后是执行工作计划。即所提建设方案的实现。任何研发任务都不可能在一开始就被提供一切必要的资源,在最好的情况下,所需的各类资源也仅仅能够做到分批到位,部分资源可能还需要反复协调。同时,任何研发任务的进展都不可能如预期一样,有时会遇上一些未曾考虑或超出预期的困难。这就表示在完成研发任务时,可能需要额外的资源,也可能需要在得到管理者的认可后,根据现实情况调整研发次序或调整研发方案。当相关数字技术平台或应用的研发阶段性完成后,其实际落地也有可能会因为一些工程上(如设备、网络、权限)或是体验上的问题而存在困难,这也需要予以关注并及时克服。在某些时候,对应用的功能需求会随着相关应用的研发与落地而逐渐提高,当用户对应用提出了更高层次的需求时,便应将之收集并考虑为此补充乃至开展新一期的研发工作。

人工智能与数字化转型的联系密切,数字化转型是人工智能重要的表现舞台,人工智能则是数字化转型重要的登场角色。尽管两者没有必然联系,然而两者的特性共同决定了彼此选择的这一结果。

对数字化转型而言,人工智能技术是实现数据价值产出十分重要的工具,也对企业数据和技术支撑能力提出了相对较高的要求。人工智能技术的适用性广、数据挖掘能力强,对于许多与数字化转型有关的业务需求,人工智能技术往往是最合适乃至不可替代的。在很多场景下,正是因为人工智能技术显现出的价值,才令人们对数字化转型的必然性和紧迫性有了深刻体会。数字化转型的实现需要一切能够为其助力的技术,而只有充分运用人工智能技术,所形成的工作成果才能在更高程度上满足来自不同领域、不同场景、不同人员的真实需求。同时,人工智能技术的成功落地依赖于优良的数据、充足的算力、深刻的业务理解和高超的建模技巧,这表示人工智能技术要求较高水平的数据和算力支持,也要求较高水平的业务人员、建模分析人员、研发人员这3类人员协作。技术人员是否能够比较容易地就某个研究任务获取所需业务数据和业务知识、是否能够便捷地获取用于建模分析和生产运行的算力及其他技术支持,甚至可以成为对企业在该场景是否具有良好信息化水平、管理水平和充足业务人才的有效标准。

如图1-4所示,对人工智能而言,数字化转型是最能发挥其作用,也是最能实现其价值的课题之一。人工智能技术主要能够提升工作效率、改善工作体验,可在一切需要由人完成的场景发挥作用,这就表示它能被运用在大部分利用数据实现价值产出类型的工作上,能服务于现有业务的大部分场景。数字化转型则正意味着运用数字化手段在各个场景提质增效,乃至实现组织、业务与流程重塑,人工智能技术不仅高度契合其需求,在这一课题下其能力也有着极大的展现空间。与此同时,数字化转型是对企业、社会而言具有战略意义的一项任务,能促进企业与社会效能的不断增强、体验的不断改善、竞争力的不断提升。这就表示,助力数字化转型是彰显人工智能意义和价值的重要途径。

虽然数字化转型与人工智能将会紧密结合,但应该纠正一个观点——数字化转型一定带有人工智能属性,或者说只有用了人工智能技术的才可能被称为数字化转型。从数字化转型的角度来说,人工智能技术是数字化转型的可选技术之一,应该以数字化转型的实际需求为标准选择能够最好满足当前业务需求的技术,而不是基于人工智能技术另起炉灶或者强行将人工智能技术加入各种应用。不要认为引入人工智能技术就能够“实现”数字化转型,也不要为了数字化转型专门建设具有人工智能属性的应用或专门为现有应用赋予人工智能属性。企业数字化转型必然伴随着企业的组织管理、产品线和业务流的变革,包括人工智能在内的各项技术是作为上述变革的重要支撑而存在的。盲目运用人工智能技术往往无法取得预期效果,甚至适得其反。

图1-4 人工智能与数字化转型的相互依赖与支撑关系

如果企业希望成功运用人工智能技术并实现价值,就要对人工智能如何服务企业数字化转型有正确的认识。此前对人工智能的描述已经比较明显地表明,人工智能技术发挥作用的一般方式是根据用户需求,对现有业务流程进行各种有针对性的改进,实现价值产出。人工智能技术的应用,不会要求业务根据技术特性进行重大改变,也不会要求当前的各类信息系统、智能控制系统“退出舞台”,相比将之替换更多的是将之补强,如图1-5所示。例如,在一些专业属性较强的场景下,人工智能技术会与专业软件进行结合,将专业软件的处理结果作为人工智能模型的分析输入或将人工智能模型的分析结果作为专业软件的分析输入[2]。可以认为,人工智能技术以辅助而非替代的方式尝试从各个角度为企业带来提升。

图1-5 通过优化现有业务流程产生价值的人工智能示例[3]

[2] 专业软件封装程度较高且一般依赖于人工操作,因而较难自动化地接收数据并按照指定的要求输出结果,例如将分析结果自动送入某个信息系统或数据平台进行分析、展示。因此,如果需要与专业软件进行高效交互,实现交互的自动化便可能成为一大问题。

[3] 以生产企业的基本业务流程为例,在多数情况下,人工智能技术并不会彻底改变现有业务流程,而是对不同流程涉及的各种业务工作进行优化,令现有业务流程更为顺畅。图中的大类任务还可以继续细化为更多子任务。

因此,随着企业应用人工智能技术的逐渐深入,尽管不太可能有任何一个业务流程完全依托于人工智能技术,但人工智能技术将渗透每一个业务流程,即形成“泛在”于企业各类业务的人工智能。在部分场合下,可以为了突出其技术属性而集中介绍企业面向不同业务所研发的各种人工智能应用,但在实际业务工作中,要让用户感到人工智能技术是在与各种其他技术有机结合一同支撑业务的,人工智能技术虽然无处不在却不喧宾夺主。企业可适当选取部分场景进行先期探索并建设试点应用,在积累一定的应用经验之后逐渐尝试将人工智能技术应用于各种业务场景,以技术助力业务的转型升级。人工智能技术预期也将像其他技术一样逐渐变得平凡,但这个过程也正是人工智能技术融入企业乃至社会,成为其必不可少的一部分的过程。

在完成数字化转型与人工智能技术联系密切的讨论后,作为补充,接下来将主要讨论人工智能技术可能带来的价值,以便为人们选择人工智能技术支撑数字化转型工作的业务场景提供一定参考。

人工智能技术给人们带来了丰富的想象空间。人们当前从事的工作,或多或少都可能被考虑由人工智能进行替代。随着人工智能领域研究的发展,基于人工智能技术形成的应用、产品、设备的智能化水平逐渐提高,模拟人的心智的能力逐渐增强,人工智能确实如人们的这一设想,越来越多地用于解决实际问题,以及用于提升人在信息社会乃至物质社会的交互体验。如果人工智能理论研究能够继续取得进展、研究的应用落地能够持续深入推进,我们有理由相信人工智能未来将在各种领域的实际场景中发挥重要作用,既能在各种流程事务乃至分析决策中辅助甚至完全替代人的劳动,也能与人实现高度的联结互通,共同创造和谐美好的社会。

当然,现在的人工智能还远远不能做到这一点,当今的人工智能仅能在特定场景下解决特定的问题,不仅在整体能力上与人有一定差距,同时无法适应新场景、解决新问题。但即便如此,人工智能技术的应用效果和未来的应用潜力仍然显著强于传统技术。人工智能技术相比传统技术更加擅长处理高维且海量的数据、提炼隐含信息和解决复杂问题,并可通过面向当前场景的新数据进行学习及迭代,在一定程度上适应当前场景的变化。因此,考虑到人工智能良好的应用效果、巨大的应用潜力和广阔的应用前景,对人工智能保持关注、寄予希望并持续投入,尝试人工智能与各行各业进行结合不仅意义显著,亦是势所必然。

人工智能技术具备较高的通用性,可以作用于社会上各种各样的领域并实现不同的价值,但这里不从人工智能包含的技术、作用的领域,而尝试从服务的对象出发,总结人工智能可能为个人、企业乃至社会带来的价值。3类价值的总结如图1-6所示。

图1-6 人工智能可能为个人、企业乃至社会带来的价值

1.6.2.1 为个人带来的价值

就个人而言,人工智能技术首先带来的是工作强度的降低和工作效率的提高。人工智能可以大大减轻业务人员或一线职工需要完成的大量单一、重复且强度较高的工作,例如值守作业现场防范生产安全事故、检测产品生产缺陷、解答常规问题的客户服务等。对人而言,这些工作的复杂度比较有限,但一般自动化机械或信息系统的智能化水平不足以完成相应任务,因此只能由人来完成,而同时这类工作的工作量大且容错率低,通常会给人带来较高的身体负担和精神压力。人工智能如今的发展已经能够解决一部分相应问题,将人从此类工作中解放出来,改善人的工作条件和工作强度,增强人的幸福感。

与此同时,人工智能技术也能够对一些需要有相对丰富经验或知识基础才能参与的工作提供辅助支持。例如,对于调整生产工艺、故障诊断、营销策略等与业务知识和业务经验有一定关联的工作任务,运用人工智能技术进行初步分析给出判断结果,进而由业务专家结合分析结果和配套参考信息做综合判断,能够提高业务专家的分析效率,更快地产出分析结论。人工智能技术帮助业务专家完成此前繁杂的数据观察、信息收集和分析工作,给出参考的分析结果,同样能显著提升其工作效率、改善工作体验。

不仅如此,人工智能技术还可改善人们在信息社会乃至物质社会的生活体验。例如,智能客服为人们提供不间断的基础帮助,智能医疗诊断令更多的人以更低的成本得到治疗,智能音箱、机器人等使人能通过简单而自然的指令让生活更为便利,智能安防能帮助人远程监控可能发生的灾害或人员入侵等。这是人能够直接感受到的部分。除此之外,人工智能还通过提高各行业企业乃至社会整体的运行效率,间接地为人提供便利,例如智能物流实现物流运输任务的高效完成、提升用户的购物体验,智能质检实现产品的高良品率、减少消费者的售后困扰,智能农业提升农产品产量和质量、降低虫害风险、扩大消费者的选择范围等。尽管对于某些场景,人工智能技术看上去并不直接为人们提供服务,但人们实际上已经享受了其服务。

1.6.2.2 为企业带来的价值

人工智能技术对企业的价值,首先是从另一种视角下人工智能技术对员工的价值,因为企业是由员工组成的。人工智能技术对个人而言可提升工作效率、降低工作强度,这一点对企业而言则是减少用工成本;对部分需要承担社会责任、需要控制组织规模的企业而言,这也可缓解职工老龄化带来的员工补充困难问题。为业务专家提升技术辅助这一点,对企业而言便是能够更显著地提升业务专家的工作效率,更充分地展现业务专家的工作能力,在业务专家普遍稀缺的情况下更快地取得相对正确的决策建议,令企业得以迅速采取行动、取得竞争优势或提早实现效益。

与此同时,人工智能技术对企业的价值,还表现为人工智能提升企业在生产经营上的竞争力。不断争取生存空间、赢得竞争优势、巩固发展地位是每一个自由竞争企业不变的发展目标。因此,运用人工智能技术解决业务痛点、助力业务发展,是各类企业当下的必然选择。人工智能通过数种途径提升企业竞争力。一是提质增效,通过实现材料、人员、运输等生产成本的优化,提高生产、维护、运营效率,提高企业单位时间或单位成本的产出并减少生产质量问题,最终帮助企业降低经营成本、提升产品竞争力;二是决策支持,通过对面对的问题进行专门分析,为用户提供可参考的行动建议,帮助其提高反应和决策效率,为企业的迅速调整和高效运行提供保障;三是风险防控,通过识别存在的生产安全隐患,发现高风险对象,防范经营管理之中的交易风险、流程风险、法律风险,保障企业的持续安全、健康发展;四是研发产品支撑,将人工智能技术与其他技术结合,可能实现若干新产品的研发,为问题的进一步解决或体验的进一步提升提供助力。

除此之外,人们也可以将人工智能技术作为一种商业服务,通过提供功能模块、产品或服务获得直接收益。企业形成的人工智能研究成果可以用来形成解决方案对外销售,获得一定利润,在合适的情况下,这些成果还可以用于宣传自身技术能力、用于服务公共事业以体现企业对社会责任的承担,在提升企业形象方面发挥作用。企业可以根据自身的人才储备和发展战略,将对外提供人工智能服务作为一项独立的企业发展业务,包括提供算力、平台、定制解决方案等,而不是将之看作一种副业,仅仅取出现有业务中的人工智能部分、将之包装并对外销售。

1.6.2.3 为社会带来的价值

人工智能技术不仅能服务个人和企业,也能在社会层面上带来价值。政府主导研发的一些人工智能应用,能为社会的发展与稳定提供进一步的支持与保障,而人工智能为个人和企业带来的价值,实际上也会以某种形式间接惠及社会。对社会而言,人工智能应用能够提升社会效率、促进社会和谐、维护社会稳定,如今已经成为辅助社会运行的重要支撑。

从提升社会效率的角度,除此前提到的企业的生产经营效率和人的工作效率以外,人工智能技术还能以各种形式为社会流畅运行发挥作用:翻译、检索、知识图谱等技术能提升人获取信息和知识的效率;智能物流(包括超市配送)、智能医疗、智能制造等技术可提升社会的生产力,降低人的生活成本;基于图像识别和自然语言处理技术的信息提取和智能化处理能提升政府和企业的行政管理效能;智能调度、遥感图像识别等技术作用于能源调控、交通管理、环境监控等场景,能提升政府的统筹管理能力等。人工智能技术能够活用于各种场景,在提升效率方面具有广阔的发挥空间。

从促进社会和谐的角度,人工智能技术首先显著改善了人的生活体验。信息推荐技术能够主动向人提供其感兴趣的产品和信息,减少人收集和筛选信息的成本;基于物联网和语音分析的智能语音助手能够令人简单、便捷地控制家电、发送信息,以及为人提供消遣娱乐;棋牌和电子游戏的计算机玩家能够与人进行对抗与合作;一些令人耳目一新的人工智能应用,如视频生成、照片还原、聊天机器人等,既为人提供了一些娱乐,也满足了人的部分情感需求。这些应用清楚地表明,人工智能技术也可以是“温暖”的。它不仅能成为一个为人服务的工具,也能成为陪伴人的工具。

从维护社会稳定的角度,人工智能技术被用来防范来自社会的各种风险。通过综合自然语言处理、知识图谱和智能推理技术,能实现合同与交易行为的合规性审查、商业交易安全保护和金融诈骗防范;综合人脸识别、视频分析、知识图谱等技术,能实现失落人口追踪、犯罪嫌疑人员抓捕与追逃;通过基于自然语言处理的舆情分析,能实现对造谣、传谣行为的打击。以上述应用为代表,政府正全面运用人工智能保障居民人身财产安全,维护社会稳定和长治久安。

1.6.2.4 总结:人工智能技术深化应用的意义

通过对人工智能为个人、企业和社会所带来价值的讨论可以发现,人工智能应用深入渗透到各行各业,令许多对社会或个人而言曾经代价高昂的服务变得容易触及。此前所提到的基于海量数据、面向海量用户的各类人工智能服务,几乎都已经远超人力所能做到的范畴。例如,目前提供给世界上数十亿用户的搜索、翻译、推荐、路线规划等服务,在这类服务仅能由人力完成的时期,能享受到这类服务的仅有很小一部分人。人工智能实现的价值,首先便是让普通用户享受到技术革新带来的福利,同时让企业实现全方位生产效益的提升,让社会在人工智能的辅助下运行得更加高效与安全。这几类价值可能会同时在一款人工智能应用上体现,因为一款应用常常会间接和直接地同时服务几类对象。

随着人工智能技术的发展,人们可能会拥有具备自主意识的人工智能伙伴,并像人一样与之建立情感联系。相信社会将能够逐渐接受人与人工智能共同成长、共同进步,人类在艺术、思想等领域继续发挥其优势,同时运用人工智能技术完成一些重复性、机械性相对较高的工作。在人工智能技术的支持下,人类将能够在这样的社会中逐渐改善自身的生活状态、关注更高层次的需求。

人工智能可以理解为由人设计并实现的智能。人工智能(Artificial Intelligence)概念的公认起源是1956年8月在美国达特茅斯学院召开的一次会议。会议以“如何令机器像人一样使用语言、形成抽象概念、解决各种问题并自我改进”为主题,围绕数个议题进行为期两个月的讨论,并最终正式确定人工智能这一概念。如果一个对象符合人工智能的概念,我们便称其是人工智能的,或具备人工智能属性。

目前,人们对人工智能的理解主要有两种,一种是表现与人相似,即“比较像人”,另一种是具备处理复杂信息和自我学习的能力,即“比较聪明”,两种概念不完全一样。表现与人相似首先要求机器能带有如情感、不可预见的行为等与智能无关的一些与人相似的特点,同时也暗示此类机器的智能水平不需要显著超过人;而具备处理复杂信息和自我学习的能力则主要看机器的智能水平,机器在这些方面与人相当乃至超过人则被看作技术发展的一个目标或里程碑。从人工智能概念形成时人们对它的描述以及人工智能技术的用途和发展目的来看,人工智能的含义更接近后者。

人们评价一个对象是否具有人工智能属性的常见标准大体包括分析与决策能力、技术复杂性及交互体验。如果一个对象表现出更好的分析与推理能力,所应用的技术更加先进与复杂,而且带来现代感、科技感的体验,它就更有可能被认为带有人工智能属性。人们的这种认识主要来源于现实中人工智能比较公认的表现形式,例如能根据人的语言、动作灵活做出反应的机器人等,这是在社会与企业潜移默化的影响下,各种新闻媒体与文学艺术作品共同作用的结果。但是,由于这些标准如具备分析与推理能力更多描述的是程度问题而不是有无问题,因此在严格确定一个对象是否具备人工智能属性时并不非常适用。例如,如今我们可能不再认为知识规则系统是人工智能的,但它实际上确实具备有限的分析推理能力。

为了解决这一问题,这里尝试为人工智能提出一个相对宽泛的定义:人工智能是一个支持一类或多类信息处理的系统,它由人所设计与创造,能够随着不同的环境输入,根据情况采取不同的处理方式,并因此输出可能不同的结果。如图1-7所示,在这个定义下,我们仅以对象是否具有响应环境变化的能力来评价其是否智能,而以对象能完成具体任务的难度来评价其智能水平。换言之,将人们一般评价一个事物“是否”是人工智能的几项标准转到评价其人工智能的“程度”上来。如此,许多早期人工智能应用如知识规则系统或信息检索引擎将重新“取回”其人工智能属性,尽管相对智能问答、无人驾驶等时下公认的新人工智能应用而言其已经基本不再被认为是人工智能的,甚至会被专门用来与这些应用进行对比,以衬托这些新应用的人工智能色彩。

图1-7 对人工智能的定义:能对不同的输入给出不同的反馈[4]

[4] 基于这种对人工智能的定义,判断一个对象是否具备人工智能属性,不以其对输入的处理方式及其基于的技术为标准,而以其是否对不同的输入给出不同的反馈,以及这种处理过程是否由人设计并实现为标准。

人工智能领域研究的主要目标是提升各种应用、产品、设备处理复杂信息和自我学习的能力。除此之外,还有一部分研究的目标是提升人工智能产品的交互能力,特别是模拟人的心智与行为,这类目标的实现一般需要与人机交互、生物学等其他相关学科进行结合,研究成果常用于与人进行交互的设备或系统。这也间接使得人们产生“人工智能是令机器变得与人相似”的理解。

通过数十年的发展,现有的一些人工智能系统已经具备一定的分析与思考能力,乃至在特定任务上超过了人,但不能在真正的意义上在完全不受控的环境中推理和解决问题,也不能在许多不同的场景和任务下同时取得较好的表现。这类人工智能如今被人们称为“弱人工智能”,而相对应地,人们也提出了“强人工智能”“超人工智能”“通用人工智能”等概念。强人工智能要求人工智能系统能够独立思考、具有自主意识,在各种分析、推理、思考乃至创新的场景下表现与人类相当;超人工智能则更进一步,要求在几乎各种领域都强于或显著强于人类;通用人工智能则从另一个角度出发,要求人工智能能够自我学习、知识迁移、解决新问题,能够迅速适应各种从未接触过的新场景并发挥作用。人们一般认为,在未来一段时间内,人工智能领域的研究成果暂时不会突破弱人工智能水平,强人工智能、超人工智能和通用人工智能的出现依赖若干重要技术的突破,这些重要技术得以突破的时间点被称为“奇点”。

延伸讨论:相对和绝对的标准

许多评价标准并不是一成不变的,例如新与旧、好与坏,只有旧才能衬托出新,只有坏才能衬托出好。当我们说某项技术是先进的时候,它的先进实际上也是在与相对落后的技术的对比中体现的。如果某个概念本身就带有先进、新等需要通过比较才能得出的属性,而且这个属性代表的方向与世界或社会发展的方向是一致的,那么能够属于这一概念的对象必然只占很小的一部分,而且会不断发生变化,例如最新的方法、最先进的技术。

这就造成,以这些属性作为标准评价某些对象是否属于某一概念时,随着时期、环境、参照物发生变化,评价结果也会改变。如果想避免对某个对象的评价结论因时代不同而相互冲突,就应该尽量将这种抽象属性排除出评价标准。对于评价标准本身不是很明确的概念,人们有可能会因为宣传与交流中这些概念被惯常赋予的某些属性而产生误解。例如认为某些对象属于某些概念的范畴,就应具有相关的属性,或认为只要某对象具有某属性,便可以归为某概念。概念的明确会对研究与研发工作产生重要影响,如果一开始未能正确认识某些概念,那么可能只有在积累大量研究与实践经验后才能对其自然纠正。

与人工智能相关的概念包括人工智能技术、人工智能应用等。人工智能技术是令某个对象具备人工智能属性所需的多学科技术,以及综合运用这些技术的实践技巧。除技术以外,如果以人工智能修饰某概念或对象,则表明该概念或对象具有人工智能属性,例如人工智能应用是具备人工智能属性的应用,人工智能设备是指在核心功能上具备人工智能属性的设备。

人工智能技术通常具有狭义和广义两种理解,如图1-8所示。人工智能技术的狭义理解是实现令一个人工智能对象(如应用)带有人工智能属性的数据处理或信息处理技术。这类技术主要是基础技术、通用技术,一般不面向具体的业务场景,目前常被直接理解为数据分析模型,例如一个知识规则系统的判别逻辑模型、一个智能语音助手的语义分析模型等。这部分是一个人工智能对象的技术核心,对其进行修改或替换会从本质上对整个对象的人工智能属性产生影响。较宽泛的理解则增加了部分会用在人工智能对象中的交互技术,如人机交互、虚拟现实等。这类技术如果与狭义的人工智能技术结合紧密,也可以被看成人工智能技术的一种。

人工智能技术的广义理解,则是指一些运用人工智能技术实现的应用,例如无人驾驶、人脸识别、智能客服等,这里的技术进一步包含运用各类人工智能技术解决业务问题的方法和技巧。换言之,这类技术解决的是特定场景下的业务问题。目前,大部分人工智能技术研究者研究的技术属于这一类,其所从事的工作通俗地讲是运用一些通用数据分析模型,形成面向当前场景的人工智能应用或解决方案(解决方案相对更可能包含实施)。人们为了明确或强调这类技术的人工智能属性,有时会将这类技术称为人工智能应用技术,而将人工智能技术的狭义理解称为人工智能理论技术。

图1-8 人工智能技术的分类:狭义和广义的人工智能技术

狭义和广义的人工智能技术尽管有着比较明确的界限,但并不是完全独立的。例如,数据分析模型的建模思想来自对实际问题(如分类问题)的一种理解以及基于这种理解设计的解决思路,而运用这些分析模型的时候必然要考察建模理论来确定技术的适用性。只管在自己研究的理论模型中加入各种已有的分析技巧,认为这就能使模型性能充分改进,或只管在自己研究的智能应用中运用各种先进的分析模型,认为这就能使应用效果显著提升,都是不太正确的想法,人工智能技术的研究与应用都体现着人的智慧。

1.7.1节和1.7.2节讨论了人工智能和人工智能技术的含义。人工智能与两项概念有着重要关联:一是大数据;二是数据分析模型。本节将尝试理顺三者的关系,并以此对当下部分概念的正确称呼进行辨析。

大数据是一种规模大到在获取、存储、管理、分析方面超出传统软件能力范围的数据集合。它是伴随着海量数据迅速积累、计算设备功能显著增强、分析技术不断突破而兴起的一个关于数据的概念。相比一般数据,大数据具备的特征可概括为“5V”,包括体量、多样性、速度以及价值和真实[5]。大数据的这些特征,对社会的进一步发展既是新挑战,也是新机遇。处理大数据给传统信息系统带来了巨大挑战,一旦系统负荷超出了单一信息系统可能承载的上限,业务工作便可能受制于系统能力。但同时,对数量巨大、来源分散、格式多样的数据进行采集、存储和综合分析,能从中发现新知识、创造新价值、提升新能力。

[5] 和国家标准文件GB/T 35295—2017相比,这里对大数据的定义做了少许补充。在国家标准文件中大数据包括4个特征:volume(体量)、variety(多样性)、velocity(速度)和variability(多变性,即体量、速度和多样性等特征都处于多变状态)。

在各种业务场景下,政府和一些企业的数据现状实际上已经达到或越来越接近大数据的概念,可以说“大数据时代”已经来临。人们在积极寻求新技术解决性能瓶颈的同时,也积极地转变观念,用“大”的眼光来看待大数据。通过数据分析实现提质增效,逐渐成为各个行业、领域谋求转变与突破的重要方法之一。当前信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已成为国家基础战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响。

为了应对大数据带来的挑战、运用大数据实现价值,人们针对大数据的特点研发了专用于处理大数据的信息技术,可统称为大数据技术。根据所实现的功能目标,大数据技术可细分为平台技术、分析技术、可视化技术等数类。平台技术主要用于解决分布式即多机系统间的数据采集、传输、存储、处理、治理等问题,为后续的各种数据分析与处理需求提供便利。分析技术主要包括对数据的计算、统计、建模等,用于实现数据的现状描述、信息提取、知识挖掘等。可视化技术主要包括图表和其他交互形式的数据展示,用于实现数据的全面感知和决策支持。为了形成能充分支撑业务工作的应用,往往需要综合运用各种大数据技术,但这些技术一般不需要耦合在一起,而是各自形成可独立调用的功能模块,以便灵活迭代和高效迁移复用。

在几类大数据技术中,平台技术的各种功能组件是专门针对大数据的体量而设计研发的,而分析技术及可视化技术在数据量并不大的时期(甚至是计算机普及之前)已有相对成熟的方法体系和相对广泛的应用场景,现在则得到改进以适应大数据的各种特征。一般而言,大数据技术应首先理解为大数据平台技术,也可以根据场景理解为用于实现对大数据分析、处理的各种技术,如果需要专门强调大数据技术中的某个部分如可视化,则可以用“大数据可视化技术”等形式将概念拼接以明确指向。使用“大数据应用技术”的场合较少,其含义理解方式与此前提到的“人工智能应用技术”的相似。

尽管从字面上来看大数据技术专门用于处理大数据,但大数据技术本质上并不限定处理数据的体量。人们完全可以利用各类大数据技术处理“小”数据,就好像在大数据技术产生之前,人们利用处理“小”数据的传统技术解决面临的大数据问题一样。但是,任何工具都有适用场景,大数据技术也不例外。强行将大数据技术运用在一些不需要该技术也能实现业务目标的场景,可能会减少实际效益,甚至适得其反。在开展应用建设时,建议从实际出发,结合技术的运用场景、短期和长期建设目标等因素综合决定是否运用大数据技术。

运用大数据技术面向特定业务场景实现的各种功能,如海量数据处理、统计展示等,被称为大数据应用。相比运用传统技术实现的相似应用,大数据应用在数据的传输、处理、查询等任务中更加高效,在数据关联与钻取上更加便捷,在数据的分析和判别上更加智能,在数据的可视化展示效果上体验更加出众,在数据安全性上保障更为完善,可较好地弥补现有信息系统存在的各类不足。目前,各类大数据应用在越来越多行业的具体业务场景下成功落地,逐步从概念化走向价值化。

1.7.4.1 机器学习的产生

机器学习是对一类支撑数据分析的模型的总称。当机器学习被用来描述一种解决问题的方法时,一般单独出现,而在需要强调它的“模型”含义时,也会特别称为机器学习模型。模型是对事物的抽象,是面向一类问题的共性特征的通用理解和处理方法。对一个问题进行建模,指将问题理解为该模型所描述的那类共性问题,并套用相应的解决方式尝试解决。模型可以看作一种知识复用。一个模型未必能够适用于各种场景,也未必能完全解决一个具体问题,但它为这个问题提供了基本的理解思路和解决方法,供人们参考并面向特定场景进行定制。

在机器学习等数据分析模型出现前,模型大多是基于生产实践、实验观察、事实推演、理论推导形成的对某些规律的定性和定量表达,例如经济学上的供需模型、物理学上的万有引力模型等。这类模型一般称为理论模型,其中定量模型可以表示为包含固定参数的具体公式,利用计算机求解便利,对人类社会的发展起到了非常重要的作用。这类模型一般由人总结并建立,这就表示这类模型的能力取决于人的能力。人擅长在维度有限、规律明确、样本特征明显的场景下结合已有的知识进行观察、分析、推理,也擅长对特定问题进行个案分析并以点带面地提炼知识。与之相对,人不擅长观察大量且杂乱无序的数据、难以理解和分析维度较高的数据、难以察觉隐含较深的规律。这就使得随着科学研究的逐渐深入、属性维度繁多的样本数据的大量积累,特别是在没有可循的理论提供指导时,像过去一样建立一个精致且适应性强的理论模型逐渐变得困难。

在这种背景下,人们尝试建立数据分析模型,希望从数据中寻找规律而不完全依赖人工观察推理。随着分析任务的复杂、数据维度的扩充、数据量的增多,这种方式逐渐成为一种重要的知识发现手段。诞生较早的数据分析模型来自统计学,如相关性分析和回归分析等,它们分别用来考察数据维度之间的相关性、一个因变量与多个自变量的相关关系。统计学如今运用在各种研究领域,产生了许多影响深远的重要研究成果。在统计学成功证明了从数据中寻找规律这一思路的有效性后,人们开始希望数据分析模型不仅能描述数据规律,也能自主分析新数据,对其自动化和智能化水平提出了更高的要求。

为此,研究人员基于新颖的建模思想、运用相对较高的建模技巧,提出了一批新的数据分析模型,被称为机器学习。机器学习也常被称为数据挖掘,但目前在称呼上以机器学习更为普遍,两者的简单辨析可见1.7.5节。机器学习基于逐渐提升的算力、逐渐增加的数据,支撑了智能化水平更高的应用的研发。随着机器学习在理论和应用上的持续发展,挖掘数据潜在价值的观念也逐渐深入人心,人们在此影响下提出了科学研究的第四范式[6],即数据密集型科学范式,进一步强调了数据科学的重要地位。

[6] 范式是指一种公认的模型或模式。科学研究的前3个范式分别是经验科学范式(实验观察)、理论科学范式(理论推导与归纳总结)和计算科学范式(计算机仿真)。

1.7.4.2 机器学习与深度学习

机器学习是对数据进行知识提取的一套抽象理解及通用处理过程。“抽象”是指此类模型不与特定业务或场景关联;“理解”是指对数据进行知识提取,或者为了最大限度地表达数据蕴含的知识这一目标,设置具体的优化对象、优化目标及对应的数学描述;“通用”是指模型接收数据的维度和样本数目没有限制或限制较少;“处理过程”是指能在设置的目标下最好地完成给定数学任务的一种计算过程。执行这个计算过程称为“模型对数据的学习”,也称为“模型训练”,在统计学中相似的过程一般称为对数据的“拟合”。在完成训练后,模型能对相同格式的新数据进行自动分析、处理并产生预测结果,这个过程称为“模型预测”。机器学习模型的输入数据称为训练数据,被预测的具有相同格式的新数据称为预测数据。线性回归、决策树、时间序列分析等常有耳闻的模型都属于机器学习。

机器学习对数据进行的学习,最终不仅能实现对数据包含的知识的揭示,训练所得的模型还能够直接被应用于新数据的分析和评价。这是机器学习超越传统数据分析的一大特征,从这个意义上,机器便是在进行“学习”,而且“学以致用”。机器学习模型一般会设计得对数据维度和样本体量要求宽泛,以尽量做到通用。机器学习本身并不会与业务问题直接联系,但研究人员可以应用一些技巧改进模型在特定业务场景下的效果,包括提供更多的数据、更相关的数据维度、更完善的补充处理规则,乃至对模型的实现算法做专门调整等,这部分工作与业务紧密结合,由完成模型研发的技术人员按需进行。

近年来,随着机器学习的不断发展,基于机器学习中深度神经网络模型形成的一类新模型被专门赋予了“深度学习”的名字,其在研究和应用领域得到了更高的关注。深度学习是机器学习的一部分,也是目前在人工智能学术研究和通用应用领域产出最多成果的部分,在图像、视频、语音、自然语言处理等领域的当下最新一批人工智能应用中,深度学习发挥了几乎无可替代的作用。相比机器学习中的其他模型,深度学习的主要特点是模型一般需要更大量的训练数据、模型提取隐性特征与拟合数据的能力更强,以及模型之间的特异性更为显著。模型特异性这一点是指各种深度学习模型虽然都基于深度神经网络,但每个模型的应用范围往往限定在图像分类、物体识别、语音识别、语义分析、知识图谱等不同的具体任务上,深度学习内部形成了较为明确的不同细分领域,领域内的研究人员会对模型进行更具针对性的细致设计。深度学习的这一特点,令人们在提及它时,更加容易想到它的一些实际应用例子如人脸识别、机器翻译等。

对于机器学习、深度学习等数据分析模型,业务人员经常关心的一个问题是模型如何体现业务的色彩,换言之,模型对数据的学习过程如何与业务规则、业务经验相结合,模型中哪些数学表述体现了对针对业务问题的理解。这种问题的产生,是因为业务人员不完全理解数据分析模型的思想乃至数据科学的思想,在套用对业务机理模型的认识来理解数据分析模型时有一些误解。数据分析模型与业务机理模型有着显著差异。业务机理模型一般表现为规则或公式,通过直接调整模型参数来表现其对业务的理解与适配;数据分析模型与业务的结合,并不经常通过调整模型的建模思想、定义方式或模型对数据的拟合过程,而往往通过调整模型所学习的数据来实现。所学习的数据越充分地描述希望模型学习到的知识,这些知识越容易从数据中提取,模型便越容易达到预期的效果。为此,建模分析人员会对原始数据进行补充处理、建立更易学习的数据维度以帮助模型更好地提取模型中蕴含的知识。这些新数据维度被称为特征,它的建立和选择过程是模型与业务联系最集中的体现之一。另外,对模型对新数据形成的分析结果追加补充处理规则也是常见的将模型与业务结合的形式之一。关于将模型与实际业务结合的各种方法,在后续建模分析部分会进行补充讨论。

1.7.4.3 机器学习模型的分类和组成部分

机器学习可以从不同的角度进行分类。如图1-9所示,根据解决问题的类型不同,机器学习可以分成分类、回归、聚类、异常检测、时间序列分析等多个大类[7]。其中,回归是指由一组数据预测一个连续值,如产量、客流量、销售额等;聚类是指将一组数据自动聚成多个类,希望类内相似度较高而类间相似度较低;时间序列分析是指挖掘一组数据的周期性和趋势性变化规律,并对数据未来的变化情况进行预测。

[7] 这些大类实际上互有交叉,因为一个模型尽管在设计时围绕着一个特定目的,但随着模型的应用,人们往往发现它实际上能实现多种功能。例如多数回归模型也能用来分类,而大部分异常检测领域的模型实际上是其他模型的扩展应用。

另一种分类是根据模型是否使用标签(Label)。标签也称标注,作为训练数据的真实结果用于训练,例如在分类模型中用于明确某些数据属于一类、某些数据属于另一类,模型在对带标签的训练数据进行学习后,便有能力区分新数据的类别。需要使用标签的模型被称为监督学习,不需要使用标签的模型则被称为无监督学习。通常,分类、回归、时间序列和一部分异常检测模型主要属于监督学习,聚类和其他一些异常检测模型属于无监督学习。此外,还有一类模型被称为半监督学习,主要是对现有监督学习和无监督学习方法的延伸,其核心思想是用一些方式为部分数据生成学习标签。

图1-9 机器学习的几种分类

尽管机器学习包含的模型很多,且模型之间往往存在较大的区别,但它们作为数据分析模型,都包含3个核心部分,如图1-10所示。首先是模型的建立思想(简称建模思想):它描述了模型将用于解决怎样的问题以及对这个问题的具体认识,最终形成完整的问题解决思路及方法描述。其次是模型的优化目标:基于建模思想给出问题的数学描述,定义可量化的优化目标,模型的实际工作就是对这个目标进行优化。这个优化目标常称为目标函数,有时也称为代价函数或损失函数。最后是模型的优化方法:面向待优化目标,给出通用的模型最优化求解的具体运算过程,也称为模型的算法。模型的训练过程就是模型执行算法的过程,模型在其间拟合训练数据,并最终使模型参数能够在当前训练数据下实现目标函数的最优化。

图1-10 机器学习的3个核心部分

掌握模型的3个核心部分,有助于理解模型,以及总结模型之间的关联和差异,这有助于估计模型解决当前业务问题的能力、制定适应该模型的数据标准化及特征建立方式,并提升最终效果[8]

[8] 例如,基于样本空间位置的模型在样本维度较高时可能不能拥有理想的效果,因为随着维度的升高,无意义的维度的增多会给模型的距离度量结果造成干扰;同时,此类模型也显著受到各维度绝对数值大小的影响,而基于信息增益的模型如树模型则影响相对较小。

前面几节对与人工智能关联的一些概念进行了综合探讨,为了正确理解这些概念,在此对几组易于混淆的概念进行进一步辨析。

本部分另有一个未在此处涉及的重要辨析主题,即“模型”这一概念在理论研究、训练、上线应用等不同的情境下含义的差异。由于这种差异的产生,主要原因是在人工智能应用研发的不同阶段模型指代的含义不同,因此这部分内容将作为人工智能应用研发过程描述的一部分(参见4.4.9节)。

首先是大数据技术与人工智能技术、大数据应用与人工智能应用的关系。大数据技术在没有追加场景或概念限定时,一般指代支持数据采集、传输、存储、处理、查询等功能的平台技术;人工智能技术则主要指代各类数据分析模型的建立理论及运用这些模型的方法、技巧。大数据应用包含各类数据统计、分析、处理、展示应用,主要强调处理的是大数据,并不十分看重完成任务使用的数据分析方法,因而常称为大数据分析;而人工智能应用主要强调应用了人工智能技术,并不暗示建模基于的或分析的数据体量。

其次是大数据分析、数据挖掘、机器学习、深度学习之间的区别。如图1-11所示,大数据分析是大数据与数据分析联系在一起时的一般称呼,既可以指代数据统计展示,也可以指代机器学习,它主要强调的是面向大数据而非所运用的数据处理方法。人工智能与数据分析联系在一起时,则一般称为人工智能建模,数据挖掘、机器学习、深度学习都属于此类。数据挖掘包含一些统计分析方法和机器学习模型,但是数据挖掘有时也用于与统计分析进行区分,这时的数据挖掘特指机器学习,深度学习则是机器学习中特定的一部分。机器学习、深度学习一般只用作名词,主要指各种数据分析模型;数据挖掘、大数据分析也可以用作动词,即“对数据的挖掘”“对大数据的分析”,用来描述在业务场景下令数据产生价值的一连串行动。如果需要保证描述准确的同时突出大数据概念,可以将大数据分析与“统计”“模型”“应用”等词语结合使用。

图1-11 大数据分析、数据挖掘、机器学习、深度学习的包含关系

接着是大数据、人工智能、机器学习的关系。机器学习是一类数据分析模型,机器学习模型从大数据中提炼知识,并形成数据分析能力,这种分析能力将成为人工智能应用的核心,即大数据可以在机器学习的作用下形成人工智能。在一些人心中,大数据、人工智能、机器学习三者基本同时出现,有时甚至成为固定搭配。严格地说,大数据、人工智能、机器学习等概念不应等同,而且彼此也没有必然的关联性。对大数据的处理未必形成人工智能(如可视化展示),而人工智能也未必基于大数据(如知识规则系统)。这种误解产生的原因在于,当下新产生的人工智能应用越来越多地基于大数据以及机器学习模型,而且此趋势将随着时间的变化愈加显著。

最后是对在机器学习领域经常提到的“模型”与“算法”概念的理解。人们有时用“算法”两个字替换“模型”,或是直接称“模型算法”。算法是解决一个问题的具体计算流程,对模型而言,算法可看作模型在训练和预测中实际执行的操作,即1.7.4.3节中的“模型的优化方法”部分。模型的算法研究的主要目的是实现最优化目标、改善模型运行的效率和稳定性。算法这一概念实际上更普遍地出现在计算机程序设计中,计算机程序设计的算法和模型的算法在含义和研究目的上大体相似。尽管模型和算法这两个概念容易混用,但由于上下文或语境的存在,一般不会产生交流障碍。同时,由于模型、算法实际上是一种事物的抽象方式和一个固定的计算流程,本身不具备智能的特性,因此不建议用“智能”对模型和算法进行修饰,但可以用智能修饰以其为核心的研发成果,如智能解决方案、智能应用、智能设备等,就好像尽管我们有千万种表达各种特定含义的文字词汇,但只有在其被灵活组织应用、表达特定思想和观点后才能看作一篇文章一样,智能属性以用途和使用特性作为根本的评价标准,而非其所基于的技术。

尽管前面的内容对概念进行了各种讨论,但由于本书的主要目的是讨论人工智能技术如何支撑数字化转型,以及分析人工智能应用研发和落地时的重点与难点,为了便于理解,后续部分将主要讨论当前为人们公认的、新的一批人工智能技术与应用,且在特定情况下可能与部分早期人工智能技术与应用如知识规则系统等进行区分。本书一般使用“数据分析模型”或“机器学习”来称呼用于研发人工智能应用的模型。尽管深度学习包含在机器学习中,但在需要进行必要的突出强调或对比时,可能会将深度学习与机器学习并列。


相关图书

GPT图解 大模型是怎样构建的
GPT图解 大模型是怎样构建的
大语言模型:基础与前沿
大语言模型:基础与前沿
扩散模型从原理到实战
扩散模型从原理到实战
ChatGPT原理与应用开发
ChatGPT原理与应用开发
人工智能(第3版)
人工智能(第3版)
ChatGPT写作超简单
ChatGPT写作超简单

相关文章

相关课程