人工智能入行实战:从校园到职场

978-7-115-60894-9
作者: 李烨
译者:
编辑: 胡俊英龚昕岳

图书目录:

详情

本书主要讲解人工智能的技术发展和行业现状,旨在帮助读者掌握进入人工智能行业工作的知识和方法。 本书首先介绍人工智能的技术概况、人工智能对人们的生活和工作的影响,以及人工智能的三大技术——机器学习、深度学习和大数据的基本原理与应用。其次,本书介绍人工智能从业者所需要的专业技术,并提供相应的学习方法。接着,本书介绍人工智能的行业概况,并将人工智能行业的岗位分为算法岗、工程岗、数据岗和产品岗,详细介绍各岗位的工作内容、能力要求、发展方向等。随后,本书讲解在人工智能行业求职的方法,包括求职前的准备工作和求职过程中的注意事项。最后,本书通过3位人工智能行业新人的入行经历,以及对5位有一定工作经验的人工智能从业者的采访,帮助读者切实了解人工智能行业,并为读者树立求职信心。 本书可作为想要入行人工智能领域的高校学生或在职人士的就业指导,亦可作为人工智能行业的人力资源师、猎头、行业分析师等的参考图书。

图书摘要

版权信息

书名:人工智能入行实战:从校园到职场

ISBN:978-7-115-60894-9

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

著    李 烨  栾 东

责任编辑 胡俊英

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315

读者服务:

微信扫码关注【异步社区】微信公众号,回复“e60894”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。

内 容 提 要

本书主要讲解人工智能的技术发展和行业现状,旨在帮助读者掌握进入人工智能行业工作的知识和方法。

本书首先介绍人工智能的技术概况、人工智能对人们的生活和工作的影响,以及人工智能的三大技术—机器学习、深度学习和大数据的基本原理与应用。其次,本书介绍人工智能从业者所需要的专业技术,并提供相应的学习方法。接着,本书介绍人工智能的行业概况,并将人工智能行业的岗位分为算法岗、工程岗、数据岗和产品岗,详细介绍各岗位的工作内容、能力要求、发展方向等。随后,本书讲解在人工智能行业求职的方法,包括求职前的准备工作和求职过程中的注意事项。最后,本书通过3位人工智能行业新人的入行经历,以及对5位有一定工作经验的人工智能从业者的采访,帮助读者切实了解人工智能行业并树立求职信心。

本书可作为想要入行人工智能领域的高校学生或在职人士的就业指导,亦可作为人工智能行业的人力资源师、猎头、行业分析师等的参考图书。

推 荐 辞

AI技术的迅速发展为每个人都开启了一道“智能之门”。但能否入门并获得发展的良机,靠的不仅仅是知识,还要能够将知识应用到日常的工作与生活当中。

通读本书,我看到了一名AI行业老兵历经多年的持续学习与实践探索后的心得分享——有经验,有教训,更为难得的是作者为有志于进入AI行业的新人们提供了经过实证的入行建议和成长路径参考。我相信本书能够帮助读者更加全面地掌握人工智能的入行之道。

——韦青,微软(中国)首席技术官

人工智能内容生成(Artificial Intelligence Generated Content,AIGC)领域近期发展迅猛,充分证明AI正在改变各行各业,将极大提升行业生产力,未来每个行业都需要把人工智能作为行业底座。人工智能领域既有前沿性的研究,又有很多应用场景需要技术实践落地。本书系统讲解了人工智能从业者需要的技能和学习方法,对于想要向AI行业发展的在校学生和在职人士都有很强的指导意义。

——蒋涛,CSDN创始人&董事长、极客帮创投创始合伙人

年轻人,你在关注人工智能这个热门行业吗?你想加入这个行业吗?你准备好了吗?这本书的作者是资深的人工智能从业者,这本书将告诉你人工智能职场的方方面面,对你再适合不过了。祝你成功!

——熊璋,北京航空航天大学教授、校学术委员会副主任国家教材委员会科学学科专家委员会委员

近年来,人工智能的相关技术和产品能力逐渐发展成为支撑数字经济的中坚力量。从拉勾招聘的数据中能看到,人工智能行业的整体薪酬竞争力超越了大多数行业,越来越多的求职者渴望进入人工智能行业。本书抽丝剥茧地帮助新入行者和未入行者厘清许多复杂的AI概念,梳理AI行业的发展和择业脉络,是进入AI领域就业的实用指南。

——鲍艾乐,拉勾招聘联合创始人

在“人工智能(AI)”这个字眼频繁出现的现代社会,如果你还对它知之甚少,这将是一本很友好的入门读物;如果你身处大学,正探索着将来是否要从事人工智能相关的工作,你将在这本书里找到相当全面的信息——不仅包括必要的理论概况、所需的专业技术及其学习方法,还有行业中的相关岗位介绍,甚至囊括了从业者的切身体验分享;如果你是像我一样的HR,想了解人工智能领域、更好地帮助企业招纳AI人才,这也是一本可以快速消化理解的参考书。让我们跟随微软AI领域的专业人士共同开启这趟探索之旅吧!

——郑涓,微软(中国)资深人力资源经理

前  言

在2022年6月举办的“第六届世界智能大会”上,各式各样的人工智能与实体经济融合的落地场景精彩亮相,涵盖制造、交通、医疗等众多领域。会上的数据显示,目前我国人工智能核心产业规模已超过4000亿元,各行各业基于人工智能而产生的新业态、新模式不断涌现,人工智能俨然已成为我国经济发展的加速器之一。

与此同时,2022年我国应届大学毕业生首次突破千万大关,达到了1076万人,比2021年增加167万人,规模和增量均创历史新高。就业,无论对学生个人、学校还是社会,都具有重大意义。多家求职网站发布的数据证实,从2019年起,高新科技行业的招聘需求呈现持续爆发之势,人工智能领域和大数据则是其中的翘楚。由此可见,作为新基建代表之一的人工智能行业,无论对于应届毕业生还是职场人员,都是十分向好的求职方向。

人工智能到底是什么?进入该行业需要哪些知识与技能?未来的职业发展又将如何?本书作者作为拥有人工智能行业十余年经验的从业者,将为读者一一剖析这些问题,并详细讲解在人工智能行业求职的各个环节。此外,作者还将通过自身及众多同行的经历,为读者展示人工智能行业从业者的真实工作体验与感受。

目标读者

本书适合有志于进入人工智能行业工作的大学在校生、应届毕业生及职场人员阅读。本书没有任何阅读门槛,不仅对人工智能、计算机相关专业的读者十分友好,而且其他学科专业背景的学生和在职人员也可以无障碍阅读。

读者将收获什么

通过阅读本书,读者能够了解人工智能的原理、应用和核心技术,人工智能行业的总体情况,人工智能行业各类岗位的入门要求、工作内容、职业发展路径,以及所需的知识体系及其学习方法。

考虑到在校学生及非人工智能行业从业者缺乏在人工智能行业内的求职经验,本书详细讲解了从前期准备到简历投递、面试和入职讨论等的整个求职流程。

此外,本书还提供了多位人工智能从业者的入行经历,以供读者参考。无论是专业对口的毕业生、跨专业的求职者,还是已经身在职场立志转岗到人工智能领域的在职人员,都能从中找到共鸣和启发。

本书结构

第1章 认识人工智能

本章从直观的角度讲解人工智能是什么、人工智能的主流技术与应用,以及人工智能对人类的影响。本章旨在让读者能够从全局的角度对人工智能有一个初步认识。

第2章 人工智能技术的原理与应用

本章讲解在人工智能技术中拥有核心地位的机器学习、深度学习和大数据技术的基本原理。本章旨在从科普的角度帮助读者了解人工智能技术的基础原理和应用范围。

第3章 人工智能从业者的技能包

人工智能行业中有各式各样的岗位,虽然每个岗位的要求不尽相同,但整体而言,这些岗位仍然有许多共性。本章以人工智能行业的标志性岗位——算法工程师为例,讲解本行业所需的知识体系和技术栈,并针对这些知识和技术提供学习规划、学习方法和多种工具与资源。

第4章 走进人工智能行业

本章简要介绍人工智能行业的现状和发展趋势,并分别解析算法、工程和数据三类技术性岗位的门槛、职责和发展路径。此外,本章还专门介绍人工智能行业的产品经理的特点——尤其是区别于互联网产品经理的部分,以及人工智能行业产品经理的工作内容和必备素质。

第5章 从校园到职场

有别于在学校中的学习和考试,求职、就业是一个有一定难度的系统工程,除了要具备必需的学术素质和技术能力,更需要求职者主动规划自己的职业发展,主动表达自己,并和招聘方实现良性互动。本章内容衔接校园与职场,详细讲解包含打造个人品牌、撰写简历、笔试、面试以及与招聘方协商就职细节等的求职过程。

第6章 成为人工智能从业者,是一种怎样的体验?

除了知识技能和学习方法,榜样的力量也是必不可少的。那些已经进入人工智能行业的从业者,都经历了怎样的求职历程?入职后又有怎样的感受呢?本章包含对多位不同企业、不同岗位、不同经历的人工智能从业者的采访,不同背景、境遇的读者都有可能从中找到自己的影子和目标。

致谢

本书的写作和出版过程得到了很多朋友的大力支持,在此特别感谢韩慧昌、侯鸿志、许后凡、何一凡、潘旺、刘庆鹏、刘培、陈好好、吴佩容、刘潇、黄博、陈璐给予我们的帮助。

作者简介

李烨,微软(亚洲)互联网工程院首席算法工程师,微软AI Talent Program创始人、架构师。拥有近二十年的IT行业从业经验,曾在SUN、EMC等跨国IT公司的核心研发部门工作。研究领域包含知识图谱、智能对话、自然语言理解、人工智能行业解决方案。著有《算法第一步》《机器学习极简入门》等图书。

栾东,曾任微软(亚洲)互联网工程院资深产品经理、微软AI Talent Program架构师。拥有近二十年的主机游戏领域的媒体及社区产品经验,曾在UCG Media、网易等公司工作,曾任VGTIME联合创始人、CEO。

资源与支持

本书由异步社区出品,社区(https://www.epubit.com/)将为你提供相关资源和后续服务。

您还可以扫码二维码, 关注【异步社区】微信公众号,回复“e60894”直接获取,同时可以获得异步社区15天VIP会员卡,近千本电子书免费畅读。

配套资源

本书提供如下资源:

本书配套彩图。

要获得以上配套资源,请在异步社区本书页面中单击标签,跳转到下载界面,按提示进行操作即可。注意:为保证购书读者的权益,该操作会给出相关提示,要求输入提取码进行验证。

提交勘误

作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎广大读者将发现的问题反馈给我们,帮助我们提升图书的质量。

当你发现错误时,请登录异步社区,按书名搜索,进入本书页面,单击“发表勘误”标签,输入勘误信息,单击“提交勘误”按钮即可。本书的作者和编辑会对你提交的勘误进行审核,确认并接受后,你将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。

扫码关注本书

扫描下方二维码,你将会在异步社区微信服务号中看到本书信息及相关的服务提示。

与我们联系

我们的联系邮箱是contact@epubit.com.cn。

如果你对本书有任何疑问或建议,请你发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。

如果你有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区在线投稿(直接访问www.epubit.com/contribute即可)。

如果你所在的学校、培训机构或企业想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。

如果你在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请你将怀疑有侵权行为的链接发邮件给我们。你的这一举动是对作者权益的保护,也是我们持续为你提供有价值内容的动力之源。

关于异步社区和异步图书

“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https://www.epubit.com。

“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书的品牌,依托于人民邮电出版社近30年的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的LOGO。异步图书的出版领域包括软件开发、大数据、AI、测试、前端、网络技术等。

异步社区

微信服务号

第1章 认识人工智能

1.1 人工智能是什么

当谈到人工智能时,大家会想到什么呢?可能很多读者会想到斯皮尔伯格导演的一部电影——《人工智能》,它的英文名称是Artificial Intelligence,一般简称为AI。

在这部电影中,主人公虽然是个机器人,但它看起来是个小男孩,能说话,能走路,能跟人交流,能做很多复杂的事情。可能对大多数人来说,想象中的人工智能就应该是这样的。但对于现阶段的科技发展来说,我们还无法真正造出一个能够解决一系列复杂问题,像人类一样思考、行动和交流的机器。

我们目前说的人工智能是什么?其实很简单,如果机器能做一件事情,即便是很小的一件事,在做这件事的过程中,它能够以一种完全自主的方式,比如通过人类语言和机器交流就可以指挥机器,而不需要人类向机器输入常人难懂的指令代码,如果机器能够达到这种状态就可以称作人工智能。

从字面意思上直观理解,人工智能包含“人工”和“智能”两部分。“人工”指人工智能的对象是人造的,而不是生物。例如,饲养一条狗,然后训练它,让它学会买报纸,这也是让被训练对象去做一件事。在去买报纸的过程中,如果有人拦它,它会绕开走;如果卖报纸的人不在,它会在那里等。尽管对于这些情况,并不需要主人临时的指令,狗也可以独立地完成,但狗不是人造的,而是一个天然的生物,所以我们不能把它称为人工智能。

“智能”指人工智能的对象能够独立完成一件事。这件事可能很简单,但在完成的过程中依然会涉及很多步骤,这些步骤在不同的情况下可能会差别巨大。人工智能的对象需要自己去应对这些状况以完成任务,而非每次遇到状况就要人工现场干预,给它输入命令代码。例如,对于自动翻译机,我们希望当我们对着机器说出一句中文时,它能很快给出翻译的英文结果。如果当我们说出一句不常用的中文时,它无法给出翻译的英文结果,那它也不能称为智能。

从学术的角度看,人工智能这个概念最早是由英国学者阿兰·图灵(Alan Turing)于1950年提出的。他是一位计算机科学家,同时也是一位数学家和逻辑学家。第二次世界大战期间,他带领一支小团队帮助英国政府破译了德军的英格玛密码,电影《模拟游戏》(The Imitation Game)演绎的就是这段故事。

第二次世界大战结束后,阿兰·图灵开始全身心地投入计算机领域的研究中,并于1950年发表了一篇论文,题目是《计算机器与智能》(“Computing Machinery And Intelligence”)。在这篇论文中,他首次提出了人工智能的概念,当时这个概念的名称为“会思考的机器”(Thinking Machine)。“会思考的机器”首先需要拥有感知能力,它应该能看见、能听见,而且这里的“听见”和“看见”应该指它能看见和听见自然界的事物,而不仅仅是指令。例如,对于早期的计算机,给它输入一些指令,它也能够去做一些事,但它并不能感知自然界的事物。对于“会思考的机器”,它应该能够看见自然界的风景和图像,能够听见人说话的语音、唱的歌,或者一些其他响声。在听见和看见之后,它还应该能够明白它听见和看见的都是什么,也就是说,它能够理解这些事物的含义,这就是早期人工智能在被提出时所被认为应该拥有的能力,但这些能力直到今天仍未真正完全实现。为了判断一个机器是否实现了人工智能,阿兰·图灵提出了著名的“图灵测试”。

在图灵测试中,如果一个测试者无法分辨和他进行交互的是一个机器还是一个人,或者如果和测试者进行交互的是机器,而他却以为在跟一个人进行交互,那么就认为这个机器通过了图灵测试。实际上,到今天为止,并没有哪款产品在大范围内、广义上通过了图灵测试。人工智能近年来蓬勃发展,可能会让很多人误以为通过图灵测试指日可待,但实际上,目前已知的技术方案想要通过图灵测试仍有很长的路要走。

人工智能的概念虽然在1950年就被提出,但直到1956年,在达特茅斯会议上,来自全世界的众多计算机科学家、数学家共同讨论了人工智能的概念后,人工智能才正式诞生。如图1-1所示,人工智能从1955年正式诞生后,曾经历了两次高潮,每次高潮之后又跌落谷底,而今天,它正迈向一个新的高潮。

图1-1 人工智能发展历程

人工智能的发展起起落落,每次高潮的出现都是因为一个新技术的提出,如第一款神经网络——感知机的提出,把人工智能推向了第一个高潮;反向传播算法的提出,又把它推向了第二个高潮。人工智能发展过程中低谷的出现,大多是因为提出的新技术在实际应用中起到的作用有限。从今天来看,这很大程度上是受限于当时计算机的运算能力。就这样,人工智能在发展过程中不断地经历一个个低谷和高潮。

今天,我们在生活中可以看到很多应用了人工智能技术的产品,可以看出,这一次新的人工智能发展高潮和前两次有所不同,而且这一次人工智能发展高潮真正在工业界引爆了对人才的巨量需求。第三次人工智能发展高潮来临的基础是运算率的提升,标志性的事件是2006年加拿大多伦多大学的Geoffrey Hinton教授发表的一篇关于深度神经网络的论文“A fast learning algorithm for deep belief nets”。之前神经网络两度陷入低谷,但这次他把神经网络又推向了发展高潮。以前学术界均使用CPU进行运算。CPU作为通用运算器件可以处理很多复杂运算,但在处理简单运算时,其速度和运算力都受到了很大的限制。而2006年Geoffrey Hinton教授的论文发表以后,人们发现GPU也可以用来进行运算,而且比使用CPU更简单,在进行算法优化后,GPU的运算力可达CPU的数倍。GPU出现在硬件上,在运算力上使神经网络实现了前所未有的突破。后来又推出了TPU(Tensor Processing Unit,张量处理器),从运算力上讲,其效率略低于GPU,可达GPU的70%~80%,但它的能耗非常小,远远小于GPU。在能源越来越重要的今天,TPU的优势非常明显。综合以上,可以说人工智能第三次浪潮的出现与硬件的革新密不可分。

人工智能的发展需要非常完整的技术栈,包括基础层、技术层和应用层三个层次。

基础层包括硬件技术、云计算和大数据,这些基础性技术是人工智能发展的前提,正是这些技术的出现,才使得原来必须要靠巨型计算机才能完成的事情,现在可以将其分布在一些小型机或者普通服务器上来完成。以前只有拥有集群的大企业才有能力完成这些事情,但云计算出现之后,很多小企业和个人也可以从事这方面的研究和开发了。数据相当于人工智能的食物,人工智能学习出的所有结果实际上都是从数据中提取出来的,大数据的出现使我们有可能将人工智能“喂饱”。

人工智能的技术核心是算法。例如,20世纪60、70年代出现的早期人工智能系统都是基于规则的。在20世纪60年代有一款人工智能系统SHRDLU,这个系统能做的事情特别简单,就是按照人类的自然语言指令,在一个封闭的有限空间中移动一些积木块,如把红色立方体上的绿色锥体挪到旁边白色的盒子中。它是怎么做到的呢?实际上,它把系统由什么颜色、什么形状的积木块组成,什么是移动,什么是左右,什么是上下等都编制成了规则。当我们命令它时,它会把命令先拆解成规则,然后再组合起来去完成这一系列的操作。系统的所有规则都由科学家编写而成,所以如果要增加一个积木块,那么这个积木块本身的规则,以及这个积木块和其他任何一个原有积木块之间作用的规则也要增加,这是一个非常烦琐的事情。一旦遇到新的情况,这种系统就需要人工去添加新的规则,所以这些规则的适应性非常差,导致这种系统没有什么实践的可能性。

因此,人们开始尝试让机器自己去学习规则。现在的人工智能的主要技术是机器学习和深度学习,它们立足于让机器自己去学习规则,而且能够根据不同的情况学到不同的规则,机器遇到的情况越多,学到的规则越多,只需要把它放到不同的环境中,让它自己去和这些环境交互即可。现在的人工智能,既有基于规则的部分,也有基于机器学习的部分。因为一个真实的应用系统,总需要有一些非常明晰、非常细节化的绝对不能突破的规则,这类规则由人工设定,而其他的一些规则可以靠机器学习模型来实践。无论在学术界还是工业界,机器学习和深度学习都是人工智能的核心和热点技术。从学科发展的角度来说,深度学习其实是机器学习的一部分,但由于深度学习的实现效果出色,人们逐渐加强了对深度学习的投入,目前它已上升到和机器学习并列的位置。图1-2展示了人工智能、机器学习和深度学习的包含关系。

图1-2 人工智能、机器学习和深度学习的包含关系

人工智能的应用层用于将技术产品化以供人们使用。目前,人工智能在自动驾驶、翻译、医疗诊断、游戏、个人助理、艺术、图像和语言识别、金融、电商、智能制造、智慧城市等领域都有着广泛的应用。

互联网方面,如必应(Bing)搜索引擎就是一个典型的互联网服务,其中很多功能模块实际使用的就是AI推荐系统,如广告点击率的预测、搜索排序、语音识别、机器翻译、图像检索、知识图谱等。

金融方面,量化相关的很多方案都和机器学习相关,如Microsoft Research的Qlib就是一个面向人工智能的量化投资平台。另外,反欺诈、智能客服等领域也会用到人工智能。

自动驾驶方面,一类是整体解决方案,如特斯拉的AutoPilot系统就是典型的人工智能综合应用案例;另一类是细分方向的解决方案,如转向预测,速度预测,道路、交规标志和障碍物的识别等单项应用。

医疗方面,早期的代表是IBM的Watson,其内部集成了很多基础的AI模块,如认知计算、影像识别、病例诊断等。目前,AI还扩展到了基因表达预测、药物研发等领域。

IT基础架构和智能运维方面,典型代表有用于异常检测的Microsoft DeepTraLog,用于虚拟机故障预测的Microsoft Narya,用于磁盘故障预测的Microsoft NTAM等。

科学计算方面,数学、物理、化学、生物都有一些应用场景。例如生物领域利用AI预测蛋白质折叠,数学领域利用AI训练验证器等。

制造业方面,AI可以用于各种瑕疵检测、故障识别与预测、智能机械臂等。

教育方面,很多公司把AI应用于教学领域,如智能拍照搜题,让AI根据不同学生的实际学习情况安排对应的课程和老师,还有一些早教机器人可以成为孩子的玩具,寓教于乐。

艺术方面,AI在这个领域的应用见仁见智。今天的AI已经可以在音乐、绘画和写作方面从事带有创作性质的工作。例如,DALL-E 2、Midjourney、Stable Diffusion等模型可以根据用户输入的文字描述自动生成图像;GPT系列模型,尤其是ChatGPT能够非常顺畅地与人类用户无话不谈;MuseNet等模型则可以将灵感展现为完整的乐曲,降低音乐创作的门槛。不过,目前AI独立创作出的这些文艺作品还是对已有内容的融合与重组,和人类的原创还有一定差距。而且,真正的艺术背后是人的经历和思考,AI独立创作出的文艺作品背后并没有任何思想支撑,所以也很难定义其价值。

游戏方面,AI在电子游戏领域的应用已经非常广泛,绝大部分游戏中都有AI控制的“对手”或“杂兵”与玩家抗衡,甚至游戏开发领域的AI辅助开发也在迅速发展中。传统桌游方面,我们也看到了AlphaGo在围棋领域的辉煌战绩,这对围棋在全世界的普及也起到了积极的作用。

智慧城市方面,AI可以用来预测空气污染物和有害物质的排放情况,分析和预测水质,规划出租车路径等,且在这些领域都已经有了实际部署。

未来,人工智能还会在更多领域帮助人类提升工作效率,摆脱重复性的劳动。

1.2 人工智能对人类的影响

人工智能的发展对人类有什么影响呢?我们可以结合图1-1所示的人工智能发展历程来思考。在每一个人工智能的发展高峰,都有人说“人类要毁灭了”,但是到了人工智能的发展低谷,又有人说“人工智能是骗子”。包括一些知名人士在内,总有人在不断提醒大家要警惕人工智能的影响,如埃隆·马斯克;还有人担心人工智能会在某些工作岗位上完全取代人类,BBC和纽约时报等知名媒体都曾经对这个话题展开过讨论,甚至还有一些研究人员给出清单,预测什么行业在什么年代会被人工智能所取代、有多大比例被取代等。

现阶段的人工智能和人类相比到底是什么水平?下面举例说明:图1-3(a)中的鸟是鸵鸟,图1-3(b)和图1-3(c)中只有一张图中是鸵鸟,另一张图中是鸸鹋,我相信读者一下就能分辨出来图1-3(b)中的鸟是鸵鸟,即使它们不是同一只鸵鸟,而且图片背景和一些具体的细节也不一样。站在人类的角度,区分生物种类是很简单的一件事。但这么简单的一个问题,如果让机器学习去完成,至少需要几万个训练样本才有可能分辨出来,而且就算是训练几万个样本得出的结果,也很可能远逊于人类,也许人为替换背景、图片颜色或者亮度后,机器学习就很难识别出正确的结果了。

(a)参考图片

(b)样本1

(c)样本2

图1-3 鸵鸟和鸸鹋

现在的深度学习,对于局部、短期的问题的理解还能胜任,例如让机器学习进行语音识别,如果只识别一句话,结果可能很好,但是如果让它去完成长期的、全局的事情,例如做会议记录,还是存在很大的障碍。再如,更长期的股票交易、外汇交易这类金融产品的趋势预测,无论是机器学习还是深度学习,其结果完全没有办法跟人类所得结果相提并论。

而且人脑相对于机器学习所需要的样本量非常少。还是以鸵鸟为例,我们只需要一张图片就能掌握很多抽象的东西,如鸵鸟的脖子又细又长,而且没有羽毛,鸸鹋却完全不同。但是如果让机器学习去分辨,它可能需要把几万张图片中的每一个像素都提取成特征,再进行大量运算才能得出结果,这个过程需要的样本和运算能力远远超过人类。

机器学习虽然能完成很多事情,但是归根结底都属于概率运算范畴。机器学习并不具备真正的理解能力,看到图片里的鸸鹋,机器并不会将其作为鸟类去欣赏,因为机器并不能理解这个东西是什么,对它来说,所有的事物仅仅是一堆数字及其对应的概率而已。表1-1所示为深度学习和人脑的对比。

表1-1 深度学习和人脑的对比

对比维度

深度学习

人脑

处理问题的范围

局部、短期

全局、长期

所需训练样本

巨量

少量

处理方式

概率运算

理解

随着深度学习一直向前发展,未来人工智能是否可以和人类相提并论呢?

先来看看人工智能发展的两个阶段,即弱人工智能阶段和强人工智能阶段。所谓弱人工智能是指人工智能可以处理某一特定领域内的具体问题,在特定领域中进行决策,并且产生一些应对的行为。例如,假设未来语音识别发展到完全可以做一名速记员,那它也仅仅是在速记领域可以达到一个人的水平,并不能解决其他的问题,如同时进行翻译,因为程序不像受过专业训练的人一样,既会速记也会翻译,还可以去学别的东西。这种特定领域内的人工智能就是弱人工智能。强人工智能指的是通用的人工智能,也就是程序或者机器可以在各个领域中进行认知、感觉、行动和学习,并能做出决策。它既可以是一个好的速记员,也可以是一个好的翻译,还能通过学习音乐成为一个优秀的作曲家。图1-4列出了强、弱人工智能的对比。

图1-4 强、弱人工智能对比

显然我们现在连弱人工智能都没有完全实现。科学技术日新月异,假设有一天我们实现了弱人工智能甚至强人工智能,那么人脑和人工智能又该作何对比呢?下面分别将人脑与强、弱人工智能进行对比。

先来对比人脑与弱人工智能。弱人工智能虽然可以在一个具体的领域里进行学习、行动和决策,但这一切仍然建立在计算的意义上,并不能真正理解事物内部的含义,也看不到整个世界。这只是在一个狭小领域内表现出来的智能,并不是真实意义上的智能。特别是对于人类的情感情绪,弱人工智能根本不可能有人类的体会,即使现在有很多人在做情感识别和情绪识别等方面的研究工作,但也只不过是把情绪和情感转换成一个标签而已,而并非让机器真正变得有感情。因此弱人工智能显然不可能跟人脑进行对决,因为人类的学习能力是全方位的,弱人工智能只能在具体的某个领域里和人类一较高下。

假设到了强人工智能的时代,真的存在一个程序,它自己能在所有的领域中学习、行动和决策,那又会怎样?到那个时候,可能普通人无论是学习的速度还是深度都已无法和强人工智能相比,我们还能说人工智能无法跟人脑对决吗?这里需要提到“人类智慧”这个词,它是人类集体或者所有人类中某一个领域的最高智慧。如果真的到了强人工智能阶段,在创造力上,人工智能还是无法和人类的最高智慧进行对决,因为真正的创造力是从无到有,可能人工智能有一些形式上的微小创新,或者是叠加一些既有事物创造出的新事物,但是真正的原创,真正发明某种东西,或者发现新的规律,是人类所独有的能力,毕竟人工智能学习到的一切都是人类已经创造出来的知识和成果。因此,人工智能并不具备凭借某种灵感创造出新事物的能力。

上面所述是强人工智能和人类最高智慧的对比,但即便是和普通人比较,在美感的体会、情绪的感知与抚慰等方面,人工智能仍然不能和普通人相比。也许人工智能可以通过数字化来描绘一种美,或者提取出关于美的数学模型,但是真正去感知美,去获得那种愉悦的感受,还是不太可能。

虽然人类有着属于自己独到的地方,但是人工智能的发展已经对我们的生活产生了影响,而且将来会产生更大的影响。作为人类,我们在未来要学会和人工智能共存,让其成为改变我们工作的一种形式。

提到改变工作的方式,最早期的人类是和工具一起工作,那个时候的工具大多是一些手持工具,原始且落后;在工业革命之后,人类开始和机器一起工作,那时的机器在力量、工作速度和强度上已远超人类,但是无法代替人类;在未来的人工智能时代,我们会和机器人一起工作,极大地改变我们的生活。

根据上面人类相对于强人工智能的优势,可以发现机器在三个方面没办法和人类竞争:首先,作为原创者的人类,在任何时代都是无可替代的;其次,即便不是原创者,人类作为美感和情感的承受者,也有机器所不能取代的成分;最后,假设一个普通人在前面两点上都无法与机器抗衡,至少还可以避开机器。人工智能要从弱到强发展,初期也只能在一个个领域中追赶人类智慧,假设在某一个领域人类智慧真的被追上了,我们至少还可以换一个领域工作,所以我们应成为一名终身学习者,保持自己随时可以学习新知识和新技能的状态,这是人类天然的优势。

相对于工作方式的改变,人工智能引起的人类教育方式的改变对人类的影响会更大,呈现的时效也会更久。在几十年前,学生在学校中学习到的主要是一些非常具体的知识,以记忆为主,但是在人工智能时代,单纯地记忆知识恐怕很难比得过机器,而且人类的脑容量终究是有限的,记忆速度也是有限的,这时我们需要从一个新的角度进行学习。

教育方式的改变主要体现在三个方面。首先,是学习内容的转变。未来学习一个事物,我们需要从三个方面去学习,一是它是如何运作的;二是它为什么会影响我们;三是如果想对它产生影响,或者想消除它的影响,我们需要整合哪些资源以及向谁求助。其次,随着学习内容的变化,相应的教学方式也会发生变化。现在学校的教学方式已经在慢慢地变化,如在线教育的出现,虽然在目前的在线教育中,互联网只是提供一个平台,两端的学生和教师还都是人类,但或许将来有一天教师就会变成人工智能,而不再是人类。因此随之就会有AI“个人导师”的出现,它可以一对一地进行教学定制,包括学生能接受到什么程度,需要学习什么内容,以及如何来指导学生进行练习,从而让所有人都可以以最高效的方式进行学习,这都是未来值得我们期待的变化。

人工智能的出现,对于现行的法律法规和道德观念的影响和冲击,也是一个很有争议的话题。例如,自动驾驶带来的车祸问题,其责任应该由谁来承担,产品的购买者、制造者,还是核心的算法工程师?又如,人类自身的数据是人工智能最直接的一类数据来源,而人工智能的大量使用会产生大量的用户隐私被盗用或滥用的问题,到那时我们该如何保护自己的隐私?而如果过于强调对隐私的保护,也可能会影响人工智能的发展,这之间的矛盾又该如何协调?这些都是我们需要面对的新难题,但目前对于类似话题的讨论并没有定论,我们还需要在发展中探索答案。

1.3 人工智能会让程序员失业吗

当人工智能逐渐强大,大家开始担心:人工智能下一步又要在哪个领域“干掉”人类?AI会让人类程序员失业吗?对此问题持肯定态度的人并不在少数。

例如,美国橡树岭国家实验室(Oak Ridge National Laboratory,ORNL)在2017年发布的论文《人机混编的代码意味着什么?人类2040年还需要亲自编写代码吗? 》(“Will humans even write code in 2040 and what would that mean for extreme heterogeneity in computing?”)中表示,到了2040年,大多数的程序代码将由机器生成。

2040年距今天还有些距离,至少当下,AI没有让程序员失业,而是让程序员更贵了。在《AI时代,为什么程序员这么贵》一文中,CSDN总裁蒋涛认为,AI的发展不仅不会使程序员消亡,反而使得各行各业比现在更加需要程序员——程序员的求职范围不再局限于软件或互联网行业,社会总需求激增,人才自然也就更贵了。

当前的势头确实如此,不过,再过5~10年,程序员还会如今日行情吗?笔者认为,在不久的将来,编程将从职业技能逐步蜕变为职场通用技能。

我们可以类比“识字”这个技能来看。百十年前,大多数人还不识字。当时,识字无疑是一种职业技能,具备了这一技能,就可以获得一个比大多数人工作环境更优越、报酬也更高的职位。但到了今天,识字率已经逼近100%,仅仅“认识字”,也只能从事低端工作。

未来,编程很可能成为人人必备的一项技能。职场中的一员,除了要具备听说读写本国语言的能力外,还得能够读程序、写代码——即使一时无法覆盖全员,至少是朝着这个方向发展。而职业编程人员将越来越少。

从语言特征(词汇、语法等)的角度讲,最复杂的编程语言也远比最简单的自然语言简单得多。我们学习各种自然语言是为了日常生活与人交流、收取信息,学习编程语言又是为什么呢?我们可以用编程语言描述事物、概念,以及它们之间的相互关系和运行方式,将大千世界转化为计算机能够理解的电信号,驱动硅晶金属构造的部件去完成我们想要完成的任务。

编程的核心在于通过各种各样的算法去实现具体的业务逻辑,把繁杂的过程抽象化、可计算化。从纯粹软件的角度讲,图灵奖获得者尼古拉斯·沃斯曾说过“Algorithm + Data Structures = Programs”,即“算法 + 数据结构 = 程序”。

受过计算机科班教育的读者一定上过一门课——数据结构与算法,这门课是计算机科学的基础。最简单的算法有排序、查找等,进阶的算法有动态规划、分治、回溯等,这些算法都是几代计算机科学家从解决现实问题中提取出的解决方案——这些才是编程的核心。

今天的程序员学习编程,首先了解编程语言的语法特征,其次掌握编译或解释的过程,以及编译器/解释器的性能、调试方法、工具等,然后配合算法,实现业务逻辑,这样几乎就可以用计算机做任意的事情了。

但把目光放长远些,只会这些还远远不够。

虽然目前基础算法和机器学习还是泾渭分明的两部分内容,但我们认为未来这两部分终将合流。

随着落地点和应用越来越多,机器学习必将融入常规编程之中。反过来,能够让越来越多的人在编程中运用机器学习的成果,也是计算机技术发展的结果。虽然人类对于用数值表达事物,用运算推演事物联系的研究已经持续了数千年,但在没有计算机的年代,稍微复杂些的数值计算就需要数学家、统计学家的介入,普通人难以胜任。后来,有了Excel之类的工具,一般人也可以胜任常用的数据统计工作了。

机器学习也是一样的道理,大量工具、框架的涌现,使得运用算法处理数据、训练模型的过程越来越简单高效。那些曾经高高在上的机器学习模型变得触手可及,只要编写几行代码,就能拿来使用了。这种便捷使得所有具备编程经验的人都可以轻松上手机器学习。

工具虽多,但要用对地方,还得掌握其基本原理。通过使用统计工具,我们可以很方便地计算均值、方差、中位数等指标,但要让计算结果有用,总要先明确这些指标的定义、计算公式和物理意义。同理,在机器学习领域,我们也有若干历史悠久的经典模型,它们从实践中来,经历了千锤百炼,在数学层面被严格证明为有效。那么,学习这些经典模型的模型函数、目标函数,从模型函数到目标函数的运算过程,各个函数相应的物理意义,最优的方法……就成了使用它们的必要前提。掌握了这些模型,再与特征工程结合,就可以用来支持现实业务了。

计算机技术飞速发展,各种工具、框架、语言日新月异,但是蕴含在机器学习中的原理和公式推导却是稳定的,经得起时间考验。我们学习机器学习,不仅是为了胜任AI工程师的岗位,也是为了掌握一种通识技能。未来机器学习极有可能会像现在的四则运算一样成为大众必备的基础能力。

另外,学习机器学习也是一种对思维的训练。用数值表达现实事物,用运算描述任务目标,再通过算法处理数据,找到达到目标的最优路径——这种思维的形成过程,远比学会模型本身更为难得。经过这种思考训练内化出的思维能力,无疑是能相伴学习者终身的助力,而这种能力也很难被机器或低端劳动所替代。

读者服务:

微信扫码关注【异步社区】微信公众号,回复“e60894”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。

相关图书

GPT图解 大模型是怎样构建的
GPT图解 大模型是怎样构建的
大语言模型:基础与前沿
大语言模型:基础与前沿
扩散模型从原理到实战
扩散模型从原理到实战
ChatGPT原理与应用开发
ChatGPT原理与应用开发
人工智能(第3版)
人工智能(第3版)
大模型应用开发 动手做AI Agent
大模型应用开发 动手做AI Agent

相关文章

相关课程