书名:人工智能技术与实践——基于MindSpore平台
ISBN:978-7-115-67611-5
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
编 著 孔令和 刘雨桐 李豫晨
责任编辑 邓昱洲 徐晓娟
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
本书是一本为人工智能初学者量身定制的实用指南,旨在帮助读者迅速掌握人工智能的核心概念和应用技巧。本书从基础概念入手,结合应用实例,使用MindSpore框架,深入浅出地引导读者理解和掌握人工智能的基本原理、技术及最新发展。全书共分为4篇16章,覆盖人工智能的各个重要领域。人工智能入门篇(第1、2章)介绍人工智能概述、人工智能发展历程、人工智能Python开发入门和MindSpore开发入门,并给出基于MNIST数据集识别手写数字的入门实战介绍。机器学习及实战篇(第3~5章)包括监督学习、无监督学习、强化学习。深度学习及实战篇(第6~10章)介绍深度神经网络、知识图谱、生成对抗网络、迁移学习和注意力机制。人工智能前沿与伦理篇(第11~16章)涉及扩散模型、推荐系统、量子计算、轻量级人工智能、人工智能大模型、人工智能伦理等前沿主题。
本书适合对人工智能感兴趣的学生及从业者,旨在帮助读者夯实理论基础,提升实际编程能力,从而在未来的学习和工作中更加游刃有余。
主 任:吕卫锋 北京航空航天大学副校长
副主任:马殿富 北京航空航天大学计算机学院教授
何钦铭 浙江大学计算机科学与技术学院教授
何炎祥 武汉大学计算机学院教授
彭红华 华为ICT战略与业务发展部总裁
唐小光 华为中国战略与Marketing部部长
孙 虎 华为服务Fellow、首席项目管理专家
孙 刚 华为ICT人才伙伴发展部部长
编 委:(按姓氏音序排列)
范 举 中国人民大学信息学院教授
方 娟 北京工业大学计算机学院副院长
郭 耀 北京大学计算机学院副院长
刘耀林 华为ICT人才伙伴发展部校企合作总监
苏统华 哈尔滨工业大学软件学院副院长
孙海龙 北京航空航天大学软件学院教授
王 菡 北京邮电大学叶培大创新创业学院副院长
王景全 华为基础软件人才发展总监
王 新 华为中国区产业发展与生态部总工
魏 彪 华为ICT学院合作总监
周 烜 华东师范大学数据科学与工程学院副院长
当下,信息技术的浪潮正以惊人的速度重塑着全球社会经济的版图。云计算、大数据、人工智能、物联网等新一代信息技术不断涌现,推动产业结构经历深刻的变革。在这场技术革命中,基础软件扮演着至关重要的角色,它不仅是信息系统的基石,更是技术创新的源泉和信息安全的守护者。
回首数十年来我国基础软件的发展历程,国家在这一领域倾注了大量资源。得益于国家科技重大专项和政策的有力支持,我国的基础软件实现了迅猛发展,步入了快车道。国产软件阵营蔚为壮观,操作系统、数据库管理系统、中间件等核心领域硕果累累,不仅在国内市场占据了一席之地,更在多个关键领域跻身国际先进行列。随着开源生态的逐步繁荣,我国也积极响应,拥抱开源生态建设。我们目睹了openEuler、OpenHarmony等国产操作系统的蓬勃发展,见证了MindSpore人工智能框架的突破性创新,以及Ascend C编程语言的闪亮登场。在华为等科技企业和广大开发者的共同努力下,基础软件在开源生态蓬勃发展的推动下取得了更大的成就。这些成就是我国基础软件实力的有力证明,也是自主创新能力的生动展示。它们不仅彰显了我国在全球化技术竞争中的坚定立场,更体现了对技术自主权的坚守与对自主创新的决心。
在全球化的技术竞争中,自主创新是我们的必由之路,开源生态建设是关键一环。开源生态支持多元化的技术体系和发展路径,有助于形成多样化的产业生态系统,满足不同行业和领域的需求;推动了技术和接口的标准化,使得不同软件之间能够更容易地实现互操作和集成;促使资源共享,减少了重复开发和资源浪费,提高了资源的利用效率。因此,未来基础软件的发展离不开开源生态的建设。
当前,在核心技术、产业生态和国际标准制定上,我国的基础软件与国际先进水平仍有一定的差距。我们必须深化对基础软件的认识,加大研发投入,更加积极地拥抱开源生态建设,培育卓越人才,以确保在科技革命和产业变革中占据有利地位。当下,各大高校正在构建相关课程体系,强化理论与实践结合,建立先进的基础软件实验室,通过校企合作,推动学术与产业的融合,致力于培养具有国际视野的高水平基础软件人才。
由此,我们精心编撰了这一丛书,以响应国家对基础软件国产化替代的战略需求,为信息技术行业的人才培养提供有力的知识支持。本丛书以国产基础软件为核心,全面覆盖操作系统、编程语言、人工智能等关键技术领域,深入剖析基础软件的发展历程、核心技术、应用案例及未来趋势,力图构建多维度、立体化的知识架构,为读者提供全方位的视角。
本丛书在内容布局上,注重系统性与实用性的结合,侧重于培养读者的实践能力和创新思维。我们不仅深入探讨基础软件的理论基础与技术原理,更通过丰富的实际案例与应用场景,展示华为等企业在该领域的最新成果与创新实践,引导读者将理论知识转化为解决实际问题的能力。本丛书的编撰团队由国内一流院校的教师和业界资深专家组成,他们深厚的学术背景和丰富的实践经验,为丛书内容的权威性和实用性提供了坚实保障。
我们期望通过这套丛书,传播国产基础软件的先进理念与优秀成果,激发广大师生与从业人员的使命感,鼓励他们投身于我国基础软件国产化的创新征程。我们坚信,唯有汇聚全社会的智慧与力量,持续推动创新,才能实现我国基础软件的自主可控与高质量发展。让我们携手并进,共同推动新一代信息技术的繁荣发展,助力我国从信息技术大国迈向信息技术强国。
北京航空航天大学副校长 吕卫锋
当下,AI创新风起云涌,大模型“百花齐放”,云计算步入“黄金时代”……我们看到,以人工智能、云计算、大数据等为代表的新一代信息技术加速突破应用,推动社会生产方式变革、创造人类生活新空间。基础软件作为新一代信息技术的底座,为信息产业和数字经济的发展提供了强有力的支撑,它不仅是各种应用软件运行的平台,还承载着数据处理、网络通信、系统安全等核心功能。一个强大、稳定、高效的基础软件体系,能够确保整个信息产业和数字经济的顺畅运行,为各种创新应用提供坚实的土壤。因此,基础软件技术也被称为“根技术”。
为构筑软件行业的根基,华为与全球伙伴一起,围绕鲲鹏、昇腾、欧拉、CANN、昇思等产品,构建数字基础设施生态,打造数字世界的算力底座。同时,华为秉持包容、公平、开放、团结和可持续的理念,与开发者共建世界级开源社区,加速软件创新和共享生态繁荣。
人才是高科技产业的关键资源。基础软件作为底层技术,通用性和专业性更强,因此需要更多对操作系统领域有深入研究、有自主创新能力的人才。
在ICT人才培养方面,华为已沉淀了30多年的丰富经验。华为将这些在ICT行业中摸爬滚打积累而来的经验、技术、人才培养标准贡献出来,联合教育主管部门、高等院校、培训机构和合作伙伴等各方生态角色,通过建设人才联盟、融入人才标准、提升人才能力、传播人才价值,构建良性ICT人才生态,从而促进科技进步、产业繁荣,助推社会可持续发展。
为培养高校ICT人才,从2013年起,华为携手全球高校共建华为ICT学院。这一校企合作项目通过提供完善的课程体系,搭建线上学习和实验平台,培养师资力量,携手高校培养创新型和应用型人才;同时通过例行发布ICT人才白皮书,举办华为ICT大赛、华为ICT人才双选会等,营造人才成长的良好环境和通路,促进人才培养良性循环。
教材是知识传递、人才培养的重要载体,华为通过校企合作模式出版教材,助力高校人才培养模式改革,推动ICT人才快速成长。为培养基础软件人才,华为聚合技术专家、高校教师等,倾心打造华为ICT学院教材。本丛书聚焦华为基础软件,内容覆盖 OpenHarmony、openEuler、MindSpore、Ascend C等基础软件技术方向,系统梳理和融合前沿基础软件技术;包含大量基于真实工作场景编写的行业实际案例,理实结合;将知识条理清晰、由浅入深地拆解分析,逻辑严谨;配套丰富的学习资源,包括源代码、实验手册、在线课程、测试题等,利于学习。本丛书既适合作为高等学校相关课程的教材,也适合作为参与相关技术方向华为认证考试的参考书,还适合计算机爱好者用以学习和探索基础软件的开发应用。
智能化的大潮正在奔涌而来,未来智能世界充满机遇和挑战。同学们,请在基础软件的知识海洋中遨游,完成知识积累,拓展实践能力,提升软件技能,为未来职场蓄力。华为也期待与你们携手,共同打造根深叶茂的操作系统基座和开源生态系统,为促进基础软件根技术生态发展、实现科技创新、促进数字经济高速增长贡献力量。
华为ICT战略与业务发展部总裁 彭红华
在当今科技快速发展的时代,人工智能正以前所未有的速度渗入我们工作、生活的各个方面。从改变商业模式到提升医疗水平,从推动智能交通发展到创新教育方式,人工智能已成为驱动社会进步的重要力量。人工智能技术日新月异,许多初学者在探索人工智能的旅程中会感到困惑,因为人工智能不仅涵盖机器学习、深度学习、自然语言处理等多个领域,还涉及数学、概率论、计算机科学等多个学科的基础知识。对新手而言,面对浩瀚的文献、繁多的算法及不同的框架与工具,从理论上往往难以厘清各个概念之间的联系,从实践上也不知从何入手。
本书的写作初衷是为希望进入人工智能领域学习或工作的读者提供清晰且易于理解的学习指南。本书基于MindSpore人工智能框架,旨在通过实践导向的教学方式,让读者能够在理论与技术之间建立起紧密的联系。本书介绍核心的概念和算法,同时配有丰富的实战案例,以引导读者在真实的编程环境中运用所学知识。
本书共分为4篇,分别是人工智能入门篇、机器学习及实战篇、深度学习及实战篇,以及人工智能前沿与伦理篇。书中深入浅出地介绍了什么是人工智能,如何运用人工智能技术解决实际问题,以及如何在道德和伦理的框架下健康发展、管理这些技术。
人工智能入门篇为读者提供人工智能的背景知识,涵盖定义、发展历程和实战入门。从实践入门的角度介绍人工智能Python编程的基本语法和定义,以及MindSpore的特点和基本操作。后续章节将采用MindSpore平台进行实战演练,帮助读者在实践中深化理解。
机器学习及实战篇深入探讨机器学习的核心概念和相关算法,包括监督学习、无监督学习和强化学习。首先介绍监督学习的基本概念,还解析了监督分类算法(K-近邻、决策树和SVM)、监督回归算法和弱监督学习。然后讨论了无监督学习的应用,无监督学习强调利用有限标注资源解决实际问题。最后介绍了强化学习的应用场景,引导读者理解智能体如何通过与环境的交互优化决策行为。这一篇的每一章都提供了实战指导。
深度学习及实战篇介绍深度学习的基本组件,包括数据处理、模型训练和预测推断。这一篇涵盖深度神经网络、知识图谱、生成对抗网络、迁移学习和注意力机制等重要主题,提供基于MindSpore的实例演示,帮助读者练习构建深度学习模型,利用大数据提高模型的图像分类及生成能力。
人工智能前沿与伦理篇探讨了扩散模型、推荐系统、量子计算、轻量级人工智能与人工智能大模型等前沿主题,展示其在各行业中的潜力与应用。这一篇深入讨论人工智能带来的安全和伦理风险,如对抗攻击、隐私侵犯和机器责任等,帮助读者在了解技术发展的同时,关注其社会影响与道德标准。
本书还提供配套的习题、开源代码、数据集,旨在为读者提供系统和全面的学习素材。无论是作为高等学校的教材,还是作为对人工智能感兴趣的各领域学者和技术人员的参考资料,本书都将为读者助力。通过本书,读者将发现人工智能不仅是科学家的专属工具,还是大众可以使用的资源。请读者不要被书中的复杂术语和算法吓倒,而是要勇敢地踏出探索的步伐。
在本书的编写过程中,孔令和教授负责整体结构的规划和内容的组织,通过合理安排各章节的内容,确保整本书的连贯性。同时,他撰写了人工智能入门篇,从宏观的视角确定本书的整体基调和内容范畴。刘雨桐博士和李豫晨博士共同承担了本书其余各章的撰写,两位博士在人工智能方面积累的研究背景和教学经验,为本书大部分章节的理论分析与实践案例提供了参考。此外,我们衷心感谢为本书编写提供帮助的专家,他们的努力与奉献使本书的完成成为可能。
我们相信,通过阅读本书,读者不仅能掌握人工智能的基本概念和技术,还能思考人工智能在社会中的伦理问题,以及如何以负责任的方式应用这些技术。希望本书能成为读者学习人工智能的良师益友,也期待读者在这条探索之路上不断前行,拥抱无限可能。
让我们一起迈入人工智能的奇妙世界吧!
本书配套完整代码,请在PC端通过浏览器登录https://box.lenovo.com/l/F5aeny下载。
人工智能入门篇学习目标
| 1 掌握人工智能的定义。 2 理解图灵测试及人工智能“三驾马车”的含义。 |
3 熟悉当前人工智能的发展路线及热门领域,激发读者利用人工智能解决实际问题的兴趣与能力。 |
人工智能(Artificial Intelligence,AI)可以被定义为机器像人类一样能够感知世界,并与之交互,通过自我学习的方式对所有领域或特定领域的问题进行记忆、推理和解决。在人工智能的探索历程中,图灵测试至今仍是测试机器智能能力的重要方式。如果人工智能在黑箱测试中,输出的内容与人类回答无法被辨别区分,则被视为通过测试。目前,对于人工智能的研究主要分为符号主义、连接主义和行为主义3类。这3类研究范式各有立场,也都有局限,当下大多数人工智能应用是3种学派思想的融会贯通。
人工智能的“三驾马车”是算法、算力和数据,其中人工智能算法研究经历了“诞生—上升—暗淡—复苏—蓬勃”的过程,与算力发展趋势相吻合。在当下大数据时代浪潮的推动下,人工智能算法研究增添了新的活力。从单技术方向(如图像识别和分类、声音识别和克隆等)到多模的AI应用开发,人工智能技术开始创造更大的价值。
本章首先简单介绍人工智能,包括人工智能的定义、图灵测试与三大研究范式;然后介绍人工智能的发展历程,从人工智能的“三驾马车”切入,介绍我国人工智能发展战略,以及人工智能前沿应用。
目前,“人工智能”一词已在生产、生活中被广泛使用,大数据、智慧城市、智能家居等众多概念都与人工智能相关。那么究竟什么是人工智能?人工智能是怎么出现的?人工智能有哪些研究范式?本节将具体讲述人工智能的定义、图灵测试的含义以及人工智能当前的研究范式。
1950年,艾伦·图灵(Alan Turing)在发表的论文《计算机器与智能》中讨论“机器能思考吗”(Can machines think?)这个问题,这表示人类开始了对机器智能的思考。1950年,图灵对机器思考的描述是“让机器做出与人类同样的行为”。随后,众多研究学者在该领域展开了广泛的探索和讨论。1956年8月,在美国达特茅斯学院,约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky,人工智能与认知学专家)、克劳德·香农(Claude Shannon,信息论的创始人)、艾伦·纽厄尔(Allen Newell,计算机科学家)、赫伯特·西蒙(Herbert Simon,诺贝尔经济学奖得主)等科学家聚在一起讨论了一个主题——用机器模仿人类学习及其他方面的智能。在达特茅斯会议上,约翰·麦卡锡提出“人工智能就是要让机器的行为看起来像是人类所表现出的智能行为一样”。马文·明斯基也提出“人工智能是一门科学,是使机器做那些人类需要通过智能来做的事情”。这次会议足足持续了两个月,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字——人工智能。因此,1956年也就成了人工智能元年。
随着人工智能的发展,人们对人工智能定义的理解也逐渐深入。如果按照拆字法的方式去理解,其中的“智能”是指学习和理解事物、处理问题并做出决策的能力,比如霍华德·加德纳(Howard Gardner)教授提出的“多元智能理论”指出多元智能的8种能力,语言智能(Linguistic Intelligence)、逻辑—数理智能(Logical-Mathematical Intelligence)、空间智能(Spatial Intelligence)、身体—动觉智能(Bodily-Kinesthetic Intelligence)、音乐智能(Musical Intelligence)、交流智能(Interpersonal Intelligence)、自省智能(Intrapersonal Intelligence)和自然观察智能(Naturalist Intelligence)。而“人工”是指人为赋予机器类似人类的某些能力,而非自然获取的。因此,人工智能可以被定义为机器像人类一样能够感知世界,并与之交互,通过自我学习的方式对所有领域或特定领域的问题进行记忆、推理和解决。
人工智能的一项重要指标是在没有任何先验知识的前提下,通过完全的自我学习,在极具挑战的领域里达到超越人类的境界,这也就衍生出了强人工智能和弱人工智能的概念。其中,强人工智能是指在各方面都能和人类比肩的人工智能,因此强人工智能不是仅限于某一领域,而是让机器人全方位实现类人的能力。强人工智能能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习。人们普遍认为基于强人工智能有可能制造出真正能推理和解决问题的智能机器,而且这样的机器将被认为是有知觉的、有自我意识的,可以独立思考问题并可制定解决问题的最优方案,有自己的价值观和世界观,有和生物一样的各种本能,如生存和安全需求,在某种意义上可以被看作一种新的文明。而我们当前仅处于弱人工智能的阶段,即不能制造出真正的可以推理和解决问题的智能机器,这些机器只不过看起来像是智能的,但是并不真正拥有智能,也不会有自主意识。弱人工智能是指专注于执行特定任务或解决特定问题的人工智能系统。这类人工智能系统通常被设计用来完成一些具体的功能,例如语音识别、图像分类、机器翻译和推荐系统等。弱人工智能在特定的领域或问题上表现卓越,通常依赖数据和算法进行决策和学习,但可能无法胜任其他领域的任务。与强人工智能相比,弱人工智能基于确定性规则和模型,而非具有人类思维和意识的完整智能,因此并不具备自我意识、理解人类情感或真实智能的能力。
在人工智能的探索历程中,图灵测试(Turing Test)作为先驱的探索方式之一,至今仍是测试机器智能能力的重要方式。试想一下,如果现在你利用即时通信软件向另一方提问:“哪种口红颜色是时下最流行的?”而对面回答:“死亡芭比粉。”你是否能判断对面是真人还是机器人?类似地,图灵测试指在测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问;进行多次测试后,如果机器让每个测试者平均做出超过30%的误判(被误认为是真人),那么它就通过了测试,并被认为具有人类智能。图灵测试的示例场景如图1-1所示。

图1-1 图灵测试的场景示例
人工智能的研究目前已经形成3个范式,分别是符号主义、连接主义和行为主义。
符号主义又称为逻辑主义、心理学派或计算机学派,认为人工智能源于数理逻辑。秉持该主义的人认为人类的认知基元是符号,人类认知的过程是利用各种符号进行推理、运算的过程。人是一个物理符号系统,计算机也是一个物理符号系统,因此,可以用计算机来模拟人的智能行为。符号主义在1956年首先采用“人工智能”这个术语,并长期一枝独秀,为人工智能的发展做出重要贡献。1956年后,符号主义的代表性成果是启发式算法、专家系统、知识工程理论与技术。其中,专家系统的成功开发与应用,对人工智能走向工程应用,实现理论联系实际具有特别重要的意义。符号主义可以被认为是科学家内省而形成的,是直接模拟人类意识、可感知的思维方式,具备较高的可解释性。但人脑大量的思考是无意识的,例如,对老司机来说,遇到不同宽度的弯道,操纵方向盘让不同大小的车顺利通过,这类思考很难给出一套通用的逻辑思路,很多时候凭借的就是开车的手感;再如,下雨不打伞就会淋雨,淋雨后很可能会感冒,这类常识为什么会存在因果关系,也需要复杂的逻辑过程来解释。符号主义对这类常识的处理效果不够令人满意——要么难以获得合理的表述;要么需要复杂的描述,开销过大。
连接主义又称为仿生学派或生理学派,认为人工智能源于仿生学,特别是对人脑模型的研究。秉持该主义的人认为人类的思维基元是神经元,而不是符号处理过程。他们从研究神经元开始进而研究神经网络模型和脑模型,成功开辟了人工智能的一条新发展道路。在连接主义的研究中,网络中的单元可以代表神经元,而连接可以代表突触,就像在人脑中一样。连接主义的代表性成果是在1943年创立的脑模型(MP模型)。二十世纪七八十年代,受限于生物原型和软硬件技术,人们对脑模型的研究一度陷入低潮。直到有专家提出用硬件模拟神经网络,1986年,大卫·鲁梅尔哈特(David Rumelhart)等人提出多层网络中的反向传播(Backpropagation,BP)算法,连接主义才重新从模型到算法,从理论分析到工程实现逐渐兴起。然而,由于连接主义主要依赖对人脑的模仿,而当前对人脑机制的研究还存在很多的空白领域,连接主义再次遇到瓶颈,同时连接主义的可解释性较差,数据的处理更多的还是一个黑盒测试过程。
行为主义又称为进化主义或控制论学派,认为人工智能源于控制论。秉持该主义的人认为智能取决于感知和行动,智能行为只能在现实世界中与周围环境交互作用而表现出来。行为主义偏向于应用实践和身体模拟,从环境中不断学习以不断修正动作,并认为控制论和感知—动作控制系统是人工智能的关键。在早期工作中,行为主义的研究主要是模拟人在控制过程中的智能行为和作用;到20世纪80年代,诞生了智能控制和智能机器人系统,例如罗德尼·布鲁克斯(Rodney Brooks)的六足行走机器人—— 一个基于感知—动作模式的模拟昆虫行为的控制系统。1948年诺伯特·维纳(Norbert Wiener)提出的控制论、1957年理查德·贝尔曼(Richard Bellman)提出的马尔可夫决策过程,以及1984年发展起来的强化学习,都是行为主义在人工智能发展过程中的里程碑事件。然而,行为主义学派强调后天学习的绝对性,忽视了先天知识和先天欲望的存在。例如,生物学实验发现,即使不给予奖励刺激,白鼠也能够越来越快地跑出迷宫。同时,行为主义学派的强化行为理论并不总是有效,从心理学角度来说,刺激与反应并非一一对应。
人工智能的概念通常与机器学习、深度学习、统计学习、数据挖掘等概念有一定关联,它们之间的关系如图1-2所示。前文给出了人工智能的定义,强调机器对人类智能的模拟、延伸和拓展。机器学习是人工智能重要的子领域之一,是指机器从经验中自动学习和改进的过程,不需要人工编写程序指定规则和逻辑。随着数据量和算力的增长,深度学习作为机器学习的子领域开始蓬勃发展,其主要特点是使用多层非线性处理单元进行特征提取和转换。每个连续的图层使用前一层的输出作为输入,除了输入输出层,深度学习包含多个隐藏层结构,能够自动提取复杂问题里的非线性特征,并通过组合低层特征形成更加抽象的高层来表示属性类别或特征。深度学习旨在建立模拟人脑进行分析和学习的神经网络,它模仿人脑的机制来解释数据,例如图像、声音和文本等,是连接主义的代表性成果。“统计学习”一词也属于人工智能的范畴,其主要基于概率空间进行模型构建和推理。统计学习和机器学习既有交叉也有区别,其中,期望统计就不属于机器学习的范畴。基于知识存储和规则构建的专家系统是人工智能的典型领域,但它既不属于机器学习也不属于统计学习。

图1-2 人工智能和其他相关联概念的关系图
除此之外,人工智能又与更广泛的数据挖掘和知识发现领域相交叉。数据挖掘和知识发现试图从海量数据中找出有用的知识,二者通过机器学习进行数据分析,通过数据库系统进行数据管理。
人工智能依赖大量数据学习经验,需要用到高效的算法,而大数据的处理和大模型的运行需要算力的支持。因此,驱动人工智能发展的3个重要因素是算法、算力和数据,被称为人工智能的“三驾马车”。
在人工智能的发展历程中,算法、算力和数据之间的密切关系体现得尤为清晰。如图1-3所示,与硬件发展趋势吻合,人工智能算法的研究也经历了“诞生—上升—暗淡—复苏—蓬勃”的过程。1943—1956年是人工智能的诞生期,这是人工智能的探索阶段。在算法领域,1943年,心理学家麦卡洛克(McCulloch)与数学家皮茨(Pitts)共同提出模仿大脑神经元模型的二元人工神经网络。1950年,艾伦·图灵发表论文《计算机器和智能》,将对机器智能的思考推上历史舞台。同年,克劳德·香农利用启发式策略让机器可下象棋。1951年,马文·明斯基和埃德蒙兹(Edmonds)建造世界上第一台神经网络计算机。1956年,达特茅斯会议的召开开启了人工智能的新纪元。这个阶段的晶体管和其后一个阶段的集成电路的发明,为构建人工智能计算设备提供了可能。

图1-3 算法和算力角度分析的人工智能发展趋势密切相关
1956—1966年是人工智能的上升期。1958年,约翰·麦卡锡设计了LISP人工智能语言及第一个基于知识的系统,解决了驾车去机场该走哪条路线的问题。1961年,艾伦·纽厄尔和赫伯特·西蒙尝试设计通用问题的解决方案。这个阶段的算法研究人员热情且大胆,但通用方案的研究布局还是太大,逐步暴露了各种问题。
1966年,美国政府取消了所有机器翻译的项目;1971年,英国政府也停止了对人工智能研究的资助。因此,1966—1971年,人工智能经历了一段时间的暗淡期。与上升期和暗淡期相对应,硬件发展出了光刻工艺(1960年)、互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)(1963年)和门阵列(1966年),但远没有达到可以支持通用方案的地步。摩尔定律(Moore’s Law,1965年)也被提出。
1971—1986年,人工智能开始复苏。算法研究者考虑将问题收敛,在专业领域提升算法的智能水平。1976年的MYCIN系统(用于传染性血液病诊断)、1979年的PROSPECTOR系统(用于矿产勘探),都是代表性成果。到1986年,已有200个专家系统构建完成。在这个阶段,1KB动态随机存取存储器(Dynamic Random Access Memory,DRAM)问世,第一个大规模集成电路出现,1981年IBM推出了第一台个人计算机(Personal Computer,PC),展现出硬件性能的突破性提升,为人工智能的复苏提供了硬件支持。
1986年至今,随着超大规模集成电路、微型芯片工艺的出现,以及存储器和运算器速度的大大提升,人工智能进入了蓬勃发展期。在大算力和大数据量的支撑下,算法领域的反向传播学习算法(1986年)、多层前馈神经网络算法(1986年)、强化学习算法(1989年)、深度学习算法(2006年)及各种人工智能大模型算法都在不断地兴起和发展。人工智能领域的发展也进入“普惠AI”的发展阶段,算法、算力和数据被更加高效地利用和融合起来,推动着当下科研创新与产业应用不断向前发展。
我国人工智能发展战略主要包括以下几个方面。
第一,构建开放、协同的人工智能科技创新体系。从前沿基础理论、关键共性技术、创新平台、高端人才队伍等方面强化部署。
第二,培育高端、高效的智能经济。发展人工智能新兴产业,推进产业智能化升级,打造人工智能创新高地。
第三,建设安全、便捷的智能社会。发展高效智能服务,提高社会治理智能化水平,利用人工智能提升公共安全保障能力,促进社会交往的共享、互信。
第四,加强人工智能领域的军民融合。促进人工智能技术军民双向转化、军民创新资源共建共享。
第五,构建泛在安全、高效的智能化基础设施体系。加强网络、大数据、高效能计算等基础设施的建设升级。
此外,2022年7月,科技部等六部门印发的《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》对我国人工智能的发展目标、核心技术突破、智能化转型与应用,以及保障措施等多个方面做出了部署,是我国在推动人工智能发展方面的重要战略。
从技术的角度来说,构建全栈、全场景的人工智能发展框架也是趋势之一。全栈基于技术功能视角,包括芯片、芯片使能、训练和推理框架以及应用使能在内的方案;全场景包括公有云、私有云、各种边缘计算、物联网行业终端及消费类终端等部署环境。Atlas作为华为全栈、全场景AI解决方案的基石,基于昇腾AI处理器提供了模块、板卡、服务器等不同形态的产品,满足客户的算力需求。ModelArts提供全流程服务、分层API和预集成方案。MindSpore提供支持端、边、云独立与协同的统一训练和推理框架。CANN提供芯片算子库和高度自动化算子开发工具。除此之外,MindX DL(昇腾深度学习组件)支持Atlas 800训练服务器、Atlas 800推理服务器的深度学习组件参考设计,提供昇腾AI处理器资源管理和监控、昇腾AI处理器优化调度、分布式训练集合通信配置生成等基本功能,快速使能合作伙伴进行深度学习平台开发。MindX Edge提供轻量化的边缘计算资源管理运维,助力行业客户快速搭建边云协同推理平台。MindX SDK提供面向行业场景的完整AI开发套件、极简易用的API及图形界面,助力开发者以极少代码快速开发行业AI应用。ModelZoo为开发者提供丰富的场景化优选预训练模型,为开发者解决了模型的选型难、训练难、优化难等问题。
华为昇腾计算产业是基于华为昇腾系列(HUAWEI Ascend)软硬件构建的全栈AI计算基础设施、合作伙伴和行业应用,其生态体系如图1-4所示。软硬件体系包括昇腾系列处理器、昇腾系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具等。昇腾计算产业生态,是围绕昇腾计算技术和产品体系所形成的生态体系,涵盖相关学术研究、技术研发、公益项目及商业活动,以及由此获取的知识成果和产品体系,还包括各种合作伙伴,主要有原始设备制造商(Original Equipment Manufacture,OEM)、原始设计制造商(Original Design Manufacture,ODM)、独立硬件开发商(Independent Hardware Vendor,IHV)、咨询与解决方案集成商(Consulting & Solution Integrator,C&SI)、独立软件开发商(Independent Software Vendor,ISV)等。昇腾的合作伙伴体系还包括围绕昇腾相关产品对外提供服务交付的服务类伙伴,提供培训服务的人才联盟伙伴,提供投融资和运营服务的投融资运营伙伴等。昇腾高度重视高校的人才培养和昇腾开发者的发展,将高校和开发者视为整个昇腾生态的重要组成部分。昇腾在多个行业的应用中展现出卓越的性能。在制造业领域,它通过生产线优化和智慧故障预测等手段显著提升了智能制造的效率;在医疗健康领域,它支持医学影像分析和基于大数据的个性化治疗,推动了医疗改革的进程;在智能交通管理领域,借助交通流量预测和自动驾驶技术,昇腾处理器实现了更为高效的管理;它还通过风险管理和智能客服等解决方案,强化了金融服务的管理水平。此外,昇腾还积极助力智慧城市建设和精准农业发展,展现出强大的实时数据处理和智能决策能力。这些应用不仅加速了企业的数字化转型,提升了其运营效率,还为各行各业的智能化发展提供了有力的支撑。

图1-4 华为昇腾计算产业生态体系
以前的AI应用是单技术方向的,例如图像识别和分类、声音识别和克隆等。随着单模到多模AI应用的开发,从感知到认知的知识计算方案落地,AI开始走进企业核心生产系统,深入企业的数字化工作,形成智慧城市、工业互联网等系统性的智能方案,开始创造更大的价值。当前人工智能的热门领域包括推荐系统、量子计算、轻量级人工智能、人工智能大模型等。下面简要介绍这4个热门领域,具体内容将在本书后续章节中展开介绍。
推荐系统是一项工程技术解决方案。该系统利用机器学习等技术,在用户进行浏览的交互过程中,主动为用户展示可能会喜欢的物品,从而促进消费,节省用户时间,提升用户体验,做到资源的优化配置。在推荐系统中,最核心的数据是用户对物品的行为数据。此类数据直接表明了用户兴趣所在。从召回到排序再到重排,系统通过复合多种推荐算法,相互补充、相互完善,不断促进推荐系统技术的演进与发展。
量子计算是基于量子力学的全新计算模式,在原理上具有远超经典计算的强大并行计算能力,为人工智能、密码分析、气象预报、资源勘探、药物设计等需要大规模计算的难题提供了解决方案,并可揭示量子相变、高温超导、量子霍尔效应等复杂物理机制。量子计算以量子比特作为信息编码和存储的基本单元,不同于传统计算机使用0或者1来存储信息。基于量子力学的叠加原理,一个量子比特可以同时处于0和1两种状态的相干叠加,即可以用于表示0和1两个数。n个量子比特便可表示2n个数的叠加,使得原理上一次量子操作可以同时实现对2n个叠加的数进行并行运算,这相当于经典计算机进行2n次操作。量子计算的实验研究是典型的高门槛研究,需要用到高质量的量子材料和器件,在超净的实验环境下,凭借非常精细的微纳加工条件才能实现极其灵敏的量子测控技术。
轻量级人工智能(Tiny AI)以一系列轻量化技术为驱动,提高芯片、平台和算法的效率,在更紧密的物理空间上实现低功耗的人工智能训练和应用部署,不需要依赖云端交互就能实现智能化操作。该技术通过小型化和精简设计,以较少的神经网络层和参数,显著减小模型的体积和计算复杂度。一方面,轻量化模型能够轻松适配资源有限的设备,以最小的计算能耗获得良好的性能,以延长设备的电池寿命。另一方面,轻量化模型具有快速部署的优势,可以实现实时响应且能够在边缘设备上进行本地推理,帮助提高数据隐私安全性。这些关键特点使得轻量级人工智能成为满足资源受限、便捷部署、高效运行等需求的理想选择。
与轻量级人工智能相反,人工智能大模型是指具有庞大规模和复杂结构的人工智能模型,它们具有数以亿计的参数和深层次的神经网络架构。这些模型通过海量数据的训练和深度神经网络(Deep Neural Network,DNN)的优化,在各种任务上取得了令人瞩目的成果。ChatGPT、LLaMA、ChatGLM、Falcon等大语言模型使用了Tokenizer、位置编码、Layer Normalization、激活函数等技术,同时借助分布式训练技术,包括数据并行、张量模型并行、流水线并行、3D并行、零冗余优化器 ZeRO、CPU卸载技术ZeRO-Offload、混合精度训练、激活重计算技术、FlashAttention、PagedAttention等,展现了强大的推理能力。
1.下列关于人工智能的叙述,错误的是 。
A.人工智能技术很新,与其他科学技术很少结合
B.“人工智能+”是科学技术发展趋势之一
C.人工智能技术与其他科学技术相结合,极大地提高了应用技术的智能化水平
D.人工智能有力地促进了社会的发展
答案:A。
2.人工智能的目的是让机器能够 ,以实现某些脑力劳动的机械化。
A.思考和创造
B.和人一样工作
C.完全代替人的大脑
D.模拟、延伸和扩展人的智能
答案:D。
3.下列 不属于人工智能的研究领域。
A.模式识别
B.机器学习
C.深度学习
D.编译原理
答案:D。
4.下列 不属于人工智能的“三驾马车”。
A.算法
B.算力
C.数据
D.深度学习
答案:D。