人工智能的故事

978-7-115-51896-5
作者: 魏铼
译者:
编辑: 刘朋

图书目录:

详情

本书以人工智能为主题,以其历史发展为主线,结合相关人物、事件和发明创造,深入浅出、生动全面地讲述了人工智能的起源和发展历程,介绍了主要的人工智能理论、技术和应用。 本书将人工智能的相关知识与趣闻轶事融为一体,有点有面,通俗易懂。对于对人工智能感兴趣的普通读者来说,这是一本难得的参考读物。

图书摘要

人工智能的故事

魏铼⊕著

人民邮电出版社

北京

图书在版编目(CIP)数据

人工智能的故事/魏铼著.--北京:人民邮电出版社,2019.12

ISBN 978-7-115-51896-5

Ⅰ.①人… Ⅱ.①魏… Ⅲ.①人工智能一普及读物 Ⅳ.①TP18-49

中国版本图书馆CIP数据核字(2019)第187282号

◆著 魏铼

责任编辑 刘朋

责任印制 陈犇

◆人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

临西县阅读时光印刷有限公司印刷

◆开本:720×960 1/16

印张:12.25  2019年12月第1版

字数:225千字  2019年12月河北第1次印刷

定价:55.00元

读者服务热线:(010)81055410 印装质量热线:(010)81055316

反盗版热线:(010)81055315

广告经营许可证:京东工商广登字20170147号

内容提要

本书以人工智能为主题,以其历史发展为主线,结合相关人物、事件和发明创造,深入浅出、生动全面地讲述了人工智能的起源和发展历程,介绍了主要的人工智能理论、技术和应用。

本书将人工智能的相关知识与趣闻轶事融为一体,有点有面,通俗易懂。对于对人工智能感兴趣的普通读者来说,这是一本难得的参考读物。

其他

仅以此书献给热爱科学、勇于探索、走向未来的朋友们。人工智能正在超越人类智能,但人类智慧将会超越一切智能!

序言

我们这一代人从小就接触过人工智能,当然不是在现实中,而是从科幻小说中。我记得小时候读过的科幻小说里有一篇是苏联作家德涅普罗夫写的《X1号机》,那是一个能根据复杂情况对股市信息进行预测的智能机器。故事是批判资本主义的,透露着这样的观点,那就是高科技带给人类的不单单是繁荣、自由和解放,还有不良制度下少数人利益的剧增和多数人的更加贫困。如果说这篇小说中的人工智能是社会批判性的,那么他的另一篇小说《苏埃玛——一个机器人的故事》则是恐怖的。在小说中,可以自我学习的人工智能发明者把智能体装入机器人的大脑,这位机器人狂热地学习人类所有的东西,直到有一天,他突然对自己创作者的大脑这个设计制造了他的原点产生了学习的渴望。于是,它拿起手术刀,追逐起自己的制造者,想要通过解剖大脑获取改进自身的最终能力。

中国人对人工智能的设想也出现得很早。现在能发现的最早的智能机器故事,自然是《列子·汤问》中的那段《偃师造人》。周穆王巡游天下的时候,遇到了漂亮的男舞者。这位舞者不但舞跳得好,还会用眼神勾引穆王的妃子。穆王大怒,想要对其进行惩处。此时,制造者才揭秘说,这并非真正的人类。他打开舞者的胸膛,展示里面有挂钩的物理结构,各种器官其实是用木头和毛皮制作的,分别挂在相应的钩子上。

人类向往智能机器已经数千年了,但这种机器还是在控制论的原理和半导体技术的发展之后才得以实现的。今天,有关人工智能的信息铺天盖地。人们甚至认为,就在不远的将来,人工智能就会夺去所有人的工作,并最终让人类堕落为机器的奴隶。这样的事情有可能吗?这样的事情会困扰你吗?

无论你个人怎么想,人工智能正在通过自己的高速发展走向现实。人工智能已经是当前新一轮科技革命和产业变革的重要驱动力量,是战略性技术,具有溢出带动性很强的“头雁”效应。不但如此,人工智能还会引发教育、医疗卫生、体育、住房、交通、助残养老、家政服务、智慧城市建设和社会治理等许多方面的巨大变化。在这样的意义下,人工智能的教育就变得刻不容缓,必须马上展开。

应该说,本书也是在相关想法鼓舞之下的一种尝试。全书通过故事的形式,将人工智能发展的历史通俗易懂地传达给读者,具有科学性、思想性、艺术性并重的特点,是一本优秀的科普读物。由于作者曾经从事过人工智能研究,对这个领域具有亲身感受,所以撰写起来驾轻就熟。又由于作者读过大量科普读物,对这类读物的特点早就有深入的分析和理解,因此写起来有一种穿越古今、纵横捭阖的气势。此外,我很赞赏作者对科学技术和人类未来的那种乐观情绪。在今天这样的时代,在万事万物都在瞬间改变、奇点随时会到来的状态下,保持这样的乐观有助于我们审慎地继续前进。

是为序。

吴岩

中国科普作家协会副理事长

南方科技大学人文社会科学学院教授兼科学与人类想象力研究中心主任

前言

人工智能起源于人类的梦想和探索。

早在远古时期,古希腊和古罗马的文学家、诗人和哲人就在他们的作品中幻想着各种具有某种神力的机械装置,中国古典文学中也不乏这样的想象。公元270年,希腊的一个理发师、发明家发明了一种可以根据水箱里水位的高低来自动决定是否蓄水的装置。它的原理和我们今天还在很多抽水马桶里采用的浮球联动阀十分相似。该装置十分简单,一个浮球连接在上、下水阀之间。当水位下降时,浮球也下降,拉开上水阀上水,在水压的作用下,下水阀关闭;当水位上升时,浮球也上升,不断推起上水阀,直至其关闭。这个浮球其实就是一个反馈信号发生器,它能感知水位的高低,并把感知的情况通过绳索正向或反向传递给上水控制阀门。这种信息反馈的概念和原理后来被普遍应用在人工智能科学里,产生了广泛而深刻的影响。

文艺复兴时期,意大利多才多艺的画家达·芬奇更是把这种幻想实践在他的发明创造之中。1495年,根据对人体结构的研究,他发明了一个像是穿着盔甲的爵士的机器人。这可能是世界上第一个像人一样的机器人。这个机器人可以自己站立和坐下,移动手臂,甚至还有表情。而这一系列动作都是由它体内的机械驱动装置完成的。这不能不让我们叹为观止。

1736年,一个叫杰克斯·达·范肯塞的法国发明家和工程师发明了一只“自动鸭子”。这只鸭子不但会嘎嘎地叫,还会拍动翅膀,用脚划水,喝水吃东西,居然还会排泄。这引起了当时人们的极大好奇。人们议论纷纷,为这只鸭子是否真的会把它吃下去的玉米粒消化并排泄出来争论不休。直到有一天,有人潜伏在暗处观察,才最终发现其实排泄物是事先装进鸭子肚子里的绿色面包屑。不过不管怎样,这只鸭子确实能够拍动翅膀,用脚划水。这在当时是一个了不起的工程设计和实现。

如果你去过北京故宫博物院里面的钟表馆,你一定看到过里面陈列的欧洲进贡来的千奇百怪的各式钟表,它们在发条动力的驱动下,通过齿轮传动,或由重力摆轮带动,使表针移动计时。后来法国的约瑟夫·玛丽·雅卡尔发明了打孔卡片,用来控制织布机。这在一定程度上是一种程序设计原理,把人类智能通过机械或程序的方式赋予机器。在用发条和打孔卡片来控制机械运动的启发下,各种简单有趣的自动机械装置层出不穷,如能自动演奏的钢琴、可以自动眨眼张嘴的木偶等。这让当时的人们大开眼界,看到了人可以做到的事情机器也可以做。

18世纪末至19世纪初,英国科学家查尔斯·斯坦霍普发明了一个“魔盒”。这个盒子的边上有滑槽,可以让人滑动槽里涂有颜色的滑块。盒子的中间有一个窗口,显示滑动到不同位置的滑块所表示出的问题及其答案。它可以用来解决一些简单的逻辑和概率问题。以今天的观点来看,这就是一台最简单的模拟式计算机。斯坦霍普的发明把人类的想象推到了抽象的数学与逻辑方面,在探索和追求人工智能方面深入了一步。有趣的是,斯坦霍普发明了这个“魔盒”以后并不想让大家知道,生怕他的专利会被别人偷走。所以,只有他的极少数亲戚和朋友在他生前有幸偷偷地观赏过这个“魔盒”的神奇演示。直到他去世以后,他的发明才公之于众。

人类从来不缺乏想象力和创造力。法国作家儒勒·凡尔纳在他的科幻小说中展现了各种各样在当时堪称神奇的想象,而今天这些想象大多已经变成了现实。科学的进步和发展一直伴随着人类文明的进步和发展,人工智能也是一样。

今天,我们就来讲一讲人工智能的故事。让这个故事带我们走进人工智能的浩瀚历史和众多天才人物之中,漫游在人工智能科学技术发展的前世今生!

第1章 条条大路通罗马

1.1 从机械计算装置开始

西班牙国家图书馆坐落在西班牙的首都马德里,它的前身是宫廷图书馆,由腓力五世建于1712年。图书馆建筑庄重典雅,雕塑林立,馆内藏书总量达800万册。

1967年的一天,在图书馆里工作的科学家们像往常一样继续对馆藏图书和资料进行着分类整理和研究工作。突然两部夹杂在其他资料中的手稿引起了大家的注意,从陈旧发黄的程度上看,这两部手稿至少有上百年的历史。当科学家们小心翼翼地仔细研究这两部手稿时,他们竟然惊讶得手足无措。他们无意中发现的是达·芬奇的两部遗失的手稿。

惊人的发现轰动一时,引发了全世界达·芬奇研究者们的极大兴趣。这两部手稿也随即被命名为“马德里手稿”。

这两部手稿中的一部创作于1503—1505年,详细描述了一台机械式计算装置,这让美国的IBM公司格外重视。1968年,IBM公司重金聘请世界著名的达·芬奇研究专家罗伯特·古泰里(Roberto Guatelli)博士按照达·芬奇的手稿复制了这台装置。

该装置由13个相互锁定的轮子组成,每个轮子有10个侧面,分别表示数字0~9。当第一个轮子转到9时,第二个轮子就会被带动,以此类推,形成进位关系。在达·芬奇生活的年代,还没有任何机器可以有这么多互相关联的运动部件,更没有人想到发明这样一台可以进行加法运算的机器。这就成为了世界上第一台机械式计算器,达·芬奇也成为世界上发明第一台机械式加法器的人。

1623年6月19日,一个叫帕斯卡的法国男孩儿降生在了一个政府税务官的家里。虽然他的教育完全是由他的父亲完成的,而不是出自哪一所名校,但他的天赋让他成为了一个神童。也许是受到父亲天天都要为税收和数字打交道的影响,他从小就对数学具有浓厚的兴趣和天生的才华。

16岁那年,他把自己发现的一个数字排列现象写成了一篇论文,称这种排列为帕斯卡三角,将这种排列所展示出的数字规律称为帕斯卡理论。他把自己的论文寄到了巴黎,让他认识的法国数学家费马转交给当时在这方面堪称专家的另外一位法国数学家德萨格。但德萨格以为这是帕斯卡父亲的研究成果,完全不相信它出自一个孩子之手。幸好有皮埃尔的担保和证明,德萨格才不得不惊叹道:“我并不为这样先于前人的发现而感到惊奇,但这样的发现出自一个16岁的孩子之手的确让我不能不深感意外。”

帕斯卡在写完论文的两年之后,为帮助父亲从无休无止的繁重计算中解放出来,发明了可以完成加减运算的机械式计算器。那年他还不满19岁。他发明的计算器领跑了随后400年机械式计算机的历史。不幸的是,由于他的计算器过于复杂和昂贵,在当时只是成为了欧洲富人的时髦玩具,而没有得到广泛使用。但这并没有影响他成为那个时代法国最著名的数学家、物理学家和发明家。

查尔斯·巴贝奇是英国的一位数学家和发明家,还是一位“富二代”。他的爸爸是一个银行家,给他留有一笔丰厚的遗产。巴贝奇有着一个宽阔的额头、两片薄薄的嘴唇和一双敏锐的眼睛。他愤世嫉俗,但又不失幽默,给人一副极富深邃思想的学者形象。

童年时代的巴贝奇就显示出了极高的数学天赋。考入剑桥大学后,他发现自己掌握的代数知识甚至超过了自己的老师。巴贝奇在毕业后留校,24岁的他受聘担任剑桥大学卢卡斯数学教授,这是一个很少有人能够获得的殊荣。然而,这位“富二代”为了自己的梦想选择了另外一条无人敢于攀登的崎岖险路,并且为之倾尽全部的财富。

1823年,英国政府做出了一个史无前例的决定,资助查尔斯·巴贝奇设计一台蒸汽机驱动的机械式通用计算机——分析机。英国政府破天荒地要制造这样一台机器是因为法国。18世纪末,法国发起了一项宏大的计算工程——人工编制《数学用表》,这个《数学用表》对于天文和航海的很多领域都有极大的帮助。然而法国动用人工编制的《数学用表》错误百出,这让巴贝奇萌生了研制计算机来完成宏大计算的构想。

他从法国人雅卡尔发明的提花织布机上获得了灵感,设计出了一台差分机。这台差分机的运算精度达到了6位小数,可以演算出好几种函数表,非常适合于编制航海和天文方面的数学用表。在此基础上,巴贝奇奋笔上书英国皇家学会,要求政府资助他建造第二台运算精度为20位小数的大型差分机。英国政府看到巴贝奇的研究有利可图,就破天荒地与科学家签订了第一份合同,财政部慷慨地为这台大型差分机的研制提供1.7万英镑的资助。在当年,这笔款项的数额无异于天文数字。

然而,出乎意料的是这台差分机的研制异常艰难。按照设计,这台差分机大约需要2.5万个零件,主要零件的误差不得超过0.025毫米,即使采用现在的加工设备和技术,要想造出这种高精度的机械也绝非易事。巴贝奇把差分机交给了英国最著名的机械工程师约瑟夫·克莱门特所属的工厂制造。第一个10年过去了,巴贝奇依然望着那些不能运转的零件发愁,全部零件只完成了不足一半的数量。参加试验的同事们再也坚持不下去了,纷纷离他而去。巴贝奇只好独自苦苦支撑了第二个10年,最后他也感到自己无力回天了。

1842年冬天,巴贝奇的内心和伦敦的气候一样寒冷,英国政府已经宣布断绝对他的一切资助,科学界的朋友们也都纷纷用一种怪异的目光看着他。一天清晨,巴贝奇蹒跚地走进车间。偌大的作业场空无一人,只剩下满地的滑车和齿轮,一片狼藉。他呆立在尚未完工的机器旁,深深地叹了口气,默默地和无力再完成的差分机告别。无可奈何的他只好把全部设计图纸和已完成的部分零件送进了位于伦敦的皇家学会博物馆供人观赏。

然而,困难和挫折并没有打垮巴贝奇。在向大型差分机进军受挫的1834年,巴贝奇就已经提出了一项更大胆的新设计——一种通用的数学计算机。巴贝奇把这种新的设计叫作“分析机”,它能够自动解算有100个变量的复杂数学题,每个数可达25位,速度可达每秒运算一次。

巴贝奇首先为分析机构思了一种齿轮式的存储库,每一个齿轮可储存10个数,总共能够储存1000个50位数。分析机的第二个部件是所谓的运算室,其基本原理与帕斯卡的转轮相似,但他改进了进位装置,使得50位数加50位数的运算可完成于转轮的一次转动之中。此外,巴贝奇也构思了送入和取出数据的机构,以及在存储库和运算室之间传输数据的部件。他甚至还考虑到如何使这台机器处理依条件转移的动作。

一个多世纪后的今天,现代计算机的结构依然几乎就是巴贝奇分析机的翻版,不同的是它的主要部件被换成了今天的超大规模集成电路。巴贝奇可算是当之无愧的计算机系统设计的“开山鼻祖”。

1.2 专家系统的萌生

在人工智能领域,专家系统是最早获得研究的分支领域。专家系统就是一种模拟人类专家解决专业领域问题的计算机程序系统。1965年由斯坦福大学开始研发的DENDRAL系统是第一个成功投入使用的专家系统,它能模仿专家来分析质谱仪的光谱,帮助化学家判定物质的分子结构。这个系统的开发者是美国人工智能科学家费根鲍姆和遗传学家李德伯格。

李德伯格可是美国的一位顶尖的科学家,他因发现细菌遗传物质及基因重组现象而获得了1958年的诺贝尔生理学或医学奖。当时,李德伯格正在进行太空生命探测,用质谱仪分析从火星上采集来的数据,看看火星上有没有可能存在生命。

费根鲍姆毕业于卡内基·梅隆大学,是有着人工智能之父之称的西蒙的得意门生。费根鲍姆本科时的专业是电子工程学,但他选修了西蒙教授的一门课程,名字叫作“社会科学中的数学模型”。在1955年圣诞假期之后的第一堂课上,西蒙教授兴冲冲地走进教室对学生们说:“在刚刚过去的这个圣诞节,我和我的同事纽厄尔发明了一台可以思考的机器!”学生们完全不知道教授所云,不能理解机器如何可以思考。为了解答学生们提出的问题,西蒙教授给大家讲起了如何通过程序设计来让计算机有智能,还派发了IBM 701大型机的使用手册,鼓励学生们亲自动手编写程序,这样他们就可以理解计算机是怎样思考的了。

费根鲍姆把操作手册带回家,兴致勃勃地连夜把它读完了。第二天天亮的时候,他感觉自己一点也不困,好像着了魔一样。当时还没有计算机科学家这样的职业,但是他下定决心要从事人工智能研究。本科毕业后,他直接去了西蒙任院长的工业管理研究生院攻读博士。可见名师的影响力有多大,他改变和奠定了一个学生一生的事业。毕业后,费根鲍姆来到了美丽的旧金山湾区。1962年,他投奔了人工智能学科创始人、另一位被称为人工智能之父的麦卡锡组建的斯坦福大学计算机系,专心搞起了人工智能研究,他的研究方向是专家系统。他希望能够找到一个特定的领域,让他能用计算机来通过对特定知识的运用和推理判断完成专家在这个领域里的工作。

1964年,费根鲍姆在斯坦福大学高等行为科学研究中心举办的一次会议上,偶然认识了当时担任斯坦福大学医学院遗传学系主任的李德伯格。在交谈中,两人对科学和哲学的共同爱好让他们一见如故,志同道合。他们,一个是专家,有数据,一个搞应用,求合作。两人一拍即合,开始了他们漫长而富有成效的研发合作。

分子由原子构成,比如H2O表示一个水分子由两个氢原子和一个氧原子组成。但是,这样的表示方式不能反映出原子之间的拓扑结构。化学家不但需要知道分子的组成元素,而且需要知道组成分子的原子之间的拓扑结构。当原子结构复杂的时候,它们之间的结构就需要借助一定的技术手段和专家积累下来的经验来判断。李德伯格就是根据质谱仪得到的数据和化学家关于质谱数据与分子构造的关系的经验知识,对可能的分子结构进行判断的。

费根鲍姆把李德伯格的方法归纳后按功能划分为3个步骤:首先利用质谱数据和化学家关于质谱数据与分子构造的关系的经验知识,对可能的分子结构形成若干约束条件,费根鲍姆称此为规划部分;然后利用李德伯格的算法,根据规划部分所生成的约束条件来控制这种可能性的展开,给出一个或几个可能的分子结构,生成结构图;接着利用化学家关于质谱数据的知识,对生成的结构图进行检测、排队,最终给出唯一的分子结构图。

费根鲍姆采用了树形结构来建立和表达所涉及的化学知识,再通过运用专家的经验知识搜索这棵知识树,通过不断认知的方式,去粗取精,去伪存真,最后得到唯一的分子结构图。

不过,说起来容易,做起来难。实际上,费根鲍姆带领他的计算机团队把专家的思路算法化花费了5年时间。在这个过程中,后来还有一个人加入,他就是美国化学家兼作家杰拉西,因为费根鲍姆在研发这套系统时发现,李德伯格是遗传学家,他对化学并不是很懂。3个人的合作成果就是世界上第一个专家系统DENDRAL。当你输入频谱仪的数据到这个系统中时,系统就会输出给定的化学结构。据说这个专家系统的结果常常比杰拉西的学生做出来的结果还准确。

DENDRAL后来成为化学家们常用的分析工具,被开发成商品软件投放市场。DENDRAL的成功证明了计算机在特定的领域可以达到人类专家的水平。费根鲍姆总结了开发DENDRAL这个专家系统的成功经验,提出了“知识工程”的概念。知识工程的方法论包含对专家知识进行获取、分析和用规则表达等一系列技术,为后来的知识库和知识图谱提供了理论基础和技术经验。

在DENDRAL之后,1976年斯坦福大学又成功地开发了用于帮助医生诊断传染性血液病的专家系统MYCIN,把人工智能技术推进到医疗系统这一重要的应用领域。

1.3 让机器学走路

一说到机器人,大家通常都会想到一个像人一样的机器,就算它长得不太像人,也会像科幻大片里的各种机器怪兽或异形那样。其实,大多数机器人长得完全不像人和任何怪兽,更多的工业机器人甚至都不会行走和移动,它们固定在自己的工位上,周而复始地完成着固定的生产任务。

最早的可以自行移动的机器人出现在1968年,它有一个名字叫Shakey,按照发音我们就叫它沙克依吧。这个名字的英文原意是“摇摇晃晃的、不稳定的、不牢靠的、可能出问题的”。用这样一个名字形容世界上第一台可以自行移动的机器人,不但幽默,而且形象,毕竟这个机器人就像孩子开始学走路一样,摇摇晃晃,不稳定,不牢靠,可能出问题。这些都是正常的。

1963年冬天,斯坦福研究院神经网络研究领域的领导者查理·罗森提出了开发一个可以自由行走的机器人的设想。当时,他想把模式识别、神经网络和人工智能编程技术综合起来,打造一台可以自行识别环境、自行“按图索骥”、自行移动的机器。为了更有把握,他特意请来了另一位大名鼎鼎的人工智能之父明斯基作为顾问,还一趟一趟地到美国国防部游说,让他们出钱资助这个项目。折腾了快3年,该项目终于成功立项,并获得了美国国防部的一笔不菲的经费,于1966年春季正式开工。

一个像工具车一样的机器人很快就初具雏形。当时它在移动过程中突然停止时会震动摇晃,开发人员就给它起了这个有趣的名字“沙克依”。沙克依由运动部分、感应部分和控制部分等组成。运动部分由发动机、车轮和机械驱动装置构成,感应部分包括激光测距仪、路障感应器和一台电视摄像机,控制部分则是一台由DEC公司生产的小型计算机PDP-10。以今天的眼光来看,沙克依似乎有些简单,它完全没有人的模样,倒是像一辆无人驾驶的小车,所能做的事情也只是在研究院的楼道和房间里转来转去,把可能挡路的障碍移开,但这在当时是一项史无前例的创新。它所蕴涵的很多技术理念沿用至今。

沙克依行走时遇到的第一个困难是它在充满障碍的房间里如何确定自己行走的路径。它要能够发现前进路线上的障碍物,一方面避免碰到障碍物,另一方面绕过障碍物继续向目标前进。在技术上,这是一个路径导航问题。研究人员运用了一种网格标记方法,让沙克依能够标记和记住它四周的环境,然后通过搜索确定绕过每一个障碍物的路径。在人工智能技术中,今天我们把这种通过不断探索得到答案的方法叫作认知学习。

沙克依行走时遇到的第二个困难是它如何规划自己的行动。当沙克依需要在复杂的环境中行走时,它可能要处理的问题就不只是发现障碍物那么简单。比如,让它从一个房间中走出来,通过走廊,进入另一个房间,遇到不能绕过的障碍物时,还要搬开障碍物,清理道路。这就涉及一个包含多个行动内容的规划问题,在人工智能技术中称之为“框架问题”。对于人类来说,这很简单,但对于计算机来说就不一样了。如何简洁清楚地表达这些情况,如何处理、协调每一个动作,如何形成一个包含多种动作的行动方案,计算机需要完成大量的计算和数据存储工作,复杂程度可能超出计算机硬件能力的许可。该项目于1966年开始启动,到1970年才最终找到一个良好的解决方法。在人工智能的发展中,每前进一步背后付出的努力都是十分巨大而鲜为人知的。在这个方法中,沙克依可以在2分钟内完成6个动作的规划任务。这个方法中的一些核心技术至今还出现在人工智能规划方面的应用中。

沙克依行走时遇到的第三个困难是它如何了解它所处的环境,识别出房间、走廊、地面、门、墙壁和大小不同的障碍物。沙克依的“眼睛”是一台电视摄像机,它必须对它“看到的场景”进行图像处理和识别,并结合激光测距仪给出的距离和位置,将其在路线图中标识出来。不同的光线、不同的角度、不同物体的形状,让图像处理和识别远没有听上去那么容易。研究人员为了简化被识别的环境,把房间里的墙壁涂成浅色,又用深色墙角板让地面和墙壁能够在颜色上容易区分开来。他们还把不同形状的障碍物都涂成红色,让障碍物变得“与众不同”,易于识别。即便如此,当时沙克依感知和分析环境、规划行动路线和方案往往需要几个小时的时间。

但不管怎么说,沙克依是世界上第一台全面应用人工智能技术的移动机器人,它能够自主进行感知和环境描述,并通过行动规划来执行指定的任务。关于它的研究成果影响至今。2004年,它光荣地进入了美国机器人名人堂。2006年,美国高科技杂志《连线》把它列为世界上最负盛名的第五个机器人,而排在它前面的有两个是科幻小说中的角色,另外两个则是出现于其后的登上火星的机器人,所以沙克依才是名副其实的机器第一人。今天,它被光荣地收藏在位于硅谷的计算机历史博物馆里,骄傲地向世人展示着它的历史成就。

1.4 触类旁通

19世纪末20世纪初,生物神经理论研究指出,人类大脑的活动是由一种叫作神经元的细胞和它们之间的联系产生的。提出这种理论的是西班牙神经解剖学家卡哈尔,他在意大利医学家高尔基发现神经细胞的基础上,描绘了神经元的组织结构和它们之间的联系。为此,1906年他们共同获得了诺贝尔生理学或医学奖。

一个神经元是一个活细胞,人类大脑有大约100亿个这样的细胞。虽然它们具有不同的形式,但它们基本上都包括位于核心的细胞本体、叫作树突的输入纤维以及一个或多个叫作轴突的输出纤维。神经元的轴突有一个叫作终止扣的凸出端,它十分接近其他神经元的树突。终止扣和其他神经元树突之间的缝隙叫作突触,大约有20纳米长。

通过电化学反应,一个神经元可以发出脉冲到它的轴突。当脉冲到达突触时,它可能激发或继承其他神经元的电化学活动。这是否会让其他神经元发出脉冲取决于当时突触所接收的各种脉冲的数量和种类。据估计,人类大脑中有大约5000亿个这样的突触,形成了一个决定人类思维活动的神经网络。

1934年,神经生理学家和控制论专家麦卡洛克和逻辑学家皮茨宣称神经元就是逻辑单元,开创了人工神经网络的历史。在他们那篇著名的论文《神经活动中思想内在性的逻辑演算》中,他们提出了一个简单的神经网络结构,并展示了这样一种神经网络可以完成几乎所有的计算操作。

人工神经网络是生物神经网络在某种简化意义下的技术复现,它是生物神经网络的一种数学抽象模型。人工神经网络中的每一个神经元可以有多个输入和输出,相当于树突和轴突。每一个输出可以有两个值(0或1)。模仿生物神经网络的行为特征,在神经元之间建立起分布式并行信息处理算法,根据输入值的多少来决定输出值,最终可以得到所需的答案。

麦卡洛克和皮茨不仅是人工智能技术中神经网络的开山鼻祖,而且两人的友谊还是一段历史佳话。出生在美国底特律的皮茨出身贫寒,但绝顶聪明,自学成才。他在12岁时就写信给大名鼎鼎的英国逻辑学家罗素,讨论罗素的《数学原理》一书中的问题。罗素欣赏他的才华,邀请他到英国剑桥大学跟他学习逻辑,可是一贫如洗的皮茨哪里有钱远渡大洋去英国读书呢?幸运的是,在他15岁那年,罗素来美国的芝加哥大学演讲,后来又做了客座教授。皮茨就跑去做了他的没有学籍的学生,靠他的天才给学校里的教授们打零工维生。

恰巧不久麦卡洛克来芝加哥大学任教,认识了皮茨。既是出于对皮茨处境的同情,又是出于对他才华的喜爱,麦卡洛克邀请皮茨来他家和他一起生活,从此皮茨结束了无家可归的“流浪生活”。麦卡洛克的年龄相当于皮茨的父亲,所以被人称为皮茨的养父。每到晚上回到家中,茶余饭后,“父子俩”就开始了他们的倾心合作。麦卡洛克是神经科学方面的专家,但他不懂数学。皮茨这个当时只有17岁的流浪数学票友就成了他的绝配。一个是数学才子,另一个是专家慈父,两个人创造了一个忘年之交的传奇、一段跨界创新的历史佳话。

人们在探索人工智能方法时这种触类旁通的跨界发明不只是人工神经网络,遗传算法是另一个从生物学中获得灵感的方法。达尔文生物进化论的核心是生物的进化规律,概括地说就是物竞天择、适者生存。于是有人想到了模拟自然进化过程中通过遗传优化来改进物种的遗传算法。这是一种模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。它的发明人叫霍兰德。

作为历史上第一个计算机科学博士的霍兰德曾经说过,如果一个人在早期过深地进入一个领域,可能会不利于他吸收新的思想。对于他来说,进化论和遗传学都是新的思想。他最喜欢读的一本书就是英国统计学家费希尔写的《自然选择的遗传理论》。该书把孟德尔的遗传理论和达尔文的自然选择结合起来,给了霍兰德启发。进化和遗传是族群学习的过程,机器学习可以此为模型。遗传算法就这样萌生了。

遗传算法是从代表问题可能潜在的解集的一个种群开始的,而一个种群则由经过基因编码的一定数目的个体组成。个体实际上是染色体带有特征的实体。染色体作为遗传物质的主要载体,即多个基因的集合,其内部表现是某种基因组合,它决定了个体的外部表现,如黑头发是由染色体中控制这一特征的某种基因组合决定的。

遗传算法是基于生物学的,理解或编程都不太难。首先,建立初始状态。初始种群是从解中随机选择出来的,将这些解比喻为染色体或基因,该种群被称为第一代。其次,评估适应度。为每一个解(染色体)指定一个适应度,应根据问题求解的实际接近程度来指定(以便逼近求解问题的答案)。不要把这些“解”与问题的“答案”混为一谈,可以把它理解成为要得到答案时系统可能需要利用的那些特性。再次,进行繁殖。具有较高适应度的那些染色体更可能产生后代(后代产生后也将发生突变)。后代是父母的产物,它们由来自父母的基因结合而成,这个过程被称为“杂交”。最后,产生下一代。如果新的一代包含一个解,能产生一个充分接近或等于期望答案的输出,那么问题就已经解决了。如果情况并非如此,新的一代将重复其父母所进行的繁衍过程,一代一代地演化下去,直到得到期望的解为止。

神经网络和遗传算法都有一个共同特点,那就是效果要等到多步以后才能看到,这就要求尽可能多地访问所有的状态。这既是对计算力的一个挑战,也是对存储空间的一个很高的要求。当时,计算机硬件的功能还远不够强大,它们的成效自然难以展现出来,毕竟理论先进不代表实际可行。所以,今天大受追捧的神经网络和遗传算法在发明之初却是曲高和寡,不受重视。现实和理想之间总是有距离的,在科学的世界里也是一样,但历史是在不断向前发展的。

1.5 让计算机理解人类的语言

1949年5月31日,《纽约时报》兴奋地发布了一条新闻:“一种新型的‘电子大脑’不仅可以进行复杂的数学运算,而且可以翻译外文。它由位于加州大学的国家标准实验室研制。参加项目研发的科学家们说,他们将实现覆盖《韦伯大学词典》6万个单词的3种语言的翻译能力。”

然而,这样一种系统的研发在当时面临着各种技术问题,最后只能无果而终。连《纽约时报》后来也不得不承认说:“如何让一台机器分辨法语中同一个单词的意思是‘桥’还是‘码头’?所有机器能做的事情只是简单地寻找一个法语单词在英语词典里对应的单词,无法从实际语义上确定应该如何翻译。”

自然语言处理一直是人工智能研究中的一个重要课题。人工智能研究早期探索的一个方向,就是想要找到一种方法能够让机器识文断字。我们知道人类的多种智能都与语言文字有着密切的关系。人类的逻辑思维以语言为形式,人类的绝大部分知识也是以语言文字的形式记载和流传下来的。

实现人机间自然语言通信意味着要使计算机既能看得懂文字,理解其中的意思,又能以自然语言的形式来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成,这就是自然语言处理。机器翻译就是自然语言处理的一个具体应用。

一个真正的机器翻译系统直到1954年1月才在美国乔治城大学开发成功。虽然它只包含了6条语法规则和250个单词,但它把几十个俄文句子成功地翻译成了英文,这在历史上还是第一次。当时还没有像现在这样方便的人机交互方式,俄文句子必须通过打孔卡片输入到一台IBM 701大型计算机中,翻译出来的英文也是通过一台连接在这台计算机上的打印机打印出来的。

在关于机器翻译的研究中一直有两种不同的方法,其中一种是以乔姆斯基为代表的语言学方法,另一种是以贾里尼克为代表的统计学方法。身为犹太人的乔姆斯基出生在美国宾夕法尼亚州的费城。虽然他从宾夕法尼亚大学取得了语言学博士学位,但他的大部分博士研究是用4年时间以哈佛年轻学者的身份在哈佛大学完成的。在博士论文的撰写中,他开始形成自己的一些语言学思想,后来他将这些思想进一步阐发,写成了《句法结构》这本被认为是20世纪理论语言学研究方面最伟大贡献的著作。这本书也成为了人工智能机器翻译语言学方法的圣经。

按照乔姆斯基的句法结构,句子可以通过一系列规则得到解析。一个句子可以解析成名词词组和动词词组,而名词词组和动词词组又可以进一步解析。他认为,所有语言都有与此类似的句法结构,这种结构是内在的,而不是通过经验得来的。在乔姆斯基的理论中,机器翻译就是通过对一个句子进行结构解析和合并重构来完成的。这其实是一种逻辑方法,并暗合于计算机科学中的有限自动机理论,成为了早期机器翻译的主要方法。

乔姆斯基不仅是一位学者,还是一名社会活动家,1967年因为反对越战坐过牢。麻省理工学院为了保护这位“口无遮拦”的“院宝”,多次为他雇用保镖保护他的人身安全,因为他的名字曾经出现在邮件炸弹的黑名单上。其实,他是一位典型的学究,率性固执,但天真善良。据说,他在狱中因为不能给学生上课而感到不安和自责。

和以乔姆斯基理论为代表的语言学方法对立的就是统计学方法。1988年,美国IBM公司沃森研究中心机器翻译小组发表了一篇关于机器翻译统计学方法的论文,并推出了法语和英语的翻译系统CANDIDE。贾里尼克作为该小组的组长,成为了机器翻译统计学方法的代表。他的名言就是“我每开除一位语言学家,我的语音识别系统的性能就能提高1倍”。看得出来,他是多么不喜欢自然语言处理中的语言学方法。

所谓统计学方法,就是在大量数据的基础上形成语料库,通过概率统计来发现数据特征,建立数据模型。实际上,这是一种建立在大数据之上的机器学习方法。简单来说,一个词在生活中的用法多种多样,但在不同环境和场合中出现的频率不同,和其他词语关联的频率也不同。我们把这种出现的频率叫作概率,把各种词语出现的概率记录下来,建立一个词语统计模型。通过这样的统计模型,我们就可以分析和理解一个句子的意思。

就在乔姆斯基一边研究他的句法结构一边积极参与反战的社会活动时,另一位德裔犹太人魏森鲍姆在麻省理工学院编写了一个用于心理咨询的会话程序ELIZA。用今天的话说,这就是一个聊天机器人,它能通过计算机终端和人进行交流。其实,ELIZA是一个超级简单的程序。它只是简单地在一个按词频排序的词库里进行搜索,如果找到了一个合适的单词来匹配,就在脚本库里选择一个合适的回复。

连魏森鲍姆教授自己也没有想到,这样一个小玩意儿竟然轰动一时。很多来麻省理工学院访问的学术界和新闻界人士都要来到他的办公室亲自和这位机器心理医生聊一聊。一次,一位来找魏森鲍姆教授谈合作的某公司副总裁在终端上聊了一会儿,觉得这玩意儿真不错。他认为一定有人在机器后面操作。于是在走的时候,他把自己的电话号码输入到终端上,说:“有时间给我打电话,好吗?”可终端一直没有回答他。这可把这位副总裁气坏了,因为从来没有人敢这样怠慢他。其实他自己输完最后一句话后没有按回车键,机器不是傲慢,而是以为他的话还没有讲完,一直在毕恭毕敬地等着他结束对话呢。

维诺格拉德不是乔姆斯基的学生,但他在读研究生的时候选修了语言学系乔姆斯基教授的句法课。因为他读的是人工智能专业,所以在期末考试的论文中,他试图说明为什么人工智能的方法可行。这让乔姆斯基很不开心,一气之下给了维诺格拉德一个C的成绩,吓得维诺格拉德再也不敢选乔姆斯基的课程了。不过,维诺格拉德的博士论文题目还是和语言有关,他开发了一个叫积木世界的东西。他用显示器展示了一个虚拟的积木世界,人们可以通过简单的自然语言,命令一个虚拟的机械手对这个积木世界里面的积木进行虚拟操作。如果机器不能确定人们给出的命令,就会向人们提问。整个系统就像一个游戏一样。

维诺格拉德的积木世界远比魏森鲍姆的机器心理医生复杂,学术意义也更加深刻。它把当时的很多人工智能技术整合到了一起,除了自然语言处理外,其中还用到了规划和知识表达。它涉及语言的很多方面,包括语言的输入、输出和生成,知识的表示和理解,世界和思想。积木世界还暗含了一种哲学思想,即意义就是语言的使用。语言的使用就是心和物(世界)之间的交互。积木世界就是语言游戏,成为了一种研究语言的方法。为此,维诺格拉德获得了国际人工智能联合会颁发的第一届“计算机与思维奖”。

第2章 什么是人工智能

2.1 人工智能第一人

人类探索人工智能的历史悠久。人工智能真正成为一门学科是由有人工智能之父称号的麦卡锡在1956年夏天达特茅斯的那次研究活动中确立的,但人工智能概念的正式提出是在1948年,出自一个英国人,他的名字叫阿兰·图灵。

图灵从小聪明绝顶,正直清高。据说上中学时,他就表现出了过人的数学天分。在数学课上,他完全不听讲,也不看书,所有定理都是自己推导出来的。他把中学以前的数学知识从头到尾“发明”了一遍,这让老师和校长大为头痛。后来校长忍无可忍,把图灵的父亲找来告状,还嘲讽地说:“你的孩子偏科,我们这里培养的是文化人,他要是想当科学家,那可是来错了地方。”鼠目寸光的校长做梦也没能预见到这个“偏科”的学生后来竟真的成为了世界上最伟大的科学家和哲学家之一。

作为富家子弟的图灵出身名校。据说他去英国剑桥大学入学报到的时候,他的父母为了避税,正带着全家在法国定居。他只好从法国跨越英吉利海峡去英国。可是渡轮到岸的时间太晚了,去学校的班车已经没有了。他二话不说,从行李里拿出随身携带的自行车,买了张地图,一路骑行赶往学校。然而,“车不作美”,中途坏了两次。近百千米的路程,他走了一夜,中途还在一家五星级酒店休息了一下。事后,他把这家五星级酒店的发票寄给父母,证明自己既没有说谎也没有乱花钱。

图灵是科班出身的数学家,在他生活的那个年代,数学就是脑袋加纸笔。他一直在想,既然数学是一门严谨而富于逻辑的学问,那么能不能发明一种机器代替纸笔进行数学运算,进而帮助人们解决一切数学和逻辑可以解决的问题?一天,他又躺在学校的草坪上仰天冥想,突然一个简单的机械装置浮现出他的脑海中,这就是后来被称为图灵机的虚拟计算装置。他的这个装置是现代计算机的核心原型和本质概括。

图灵机是一个简单得不能再简单的装置。它由3个部分构成:一条无限长的纸带,上面有无穷多的格子,每个格子里可以写1或0;一个可以移动的读写头,每次可以向当前指向的格子读或写1或0;一个逻辑规则器,可以根据在当前纸带位置上读到的是1还是0,结合逻辑规则,指示读写头向前或向后移动一个格子,或在当前的格子里写入1或0。

图灵证明了他的这个装置与计算理论中的邱奇演算和哥德尔递归函数等价,从而证明了这个简单装置的无限计算能力。有了图灵机,我们就可以把原来纯数学和逻辑的东西与物理世界的实体装置联系起来,函数变成了规则控制下的纸带和读写头。今天的电子计算机实际上就是图灵的这个虚拟计算装置的一个具体实现。被称为电子计算机之父的冯·诺依曼一直都说,他的思想来自图灵机,其核心内容就是存储程序结构,一个被编码的图灵机就是存储的程序。所以说计算机科学起源于图灵一点也不过分。1936年他发表的那篇论文《论可计算数》和文中描述的图灵机成为了人类文明中具有划时代意义的里程碑。

1939年9月1日,德国军队占领了波兰,2日英国对德国宣战,3日图灵被召往布莱切利园。这个庄园其实是英国政府的密码学校和密码破译基地,负责为英国海陆空三军提供密码加解密服务。图灵的工作是负责破解德国传奇的Enigma加密机。战时的工作十分繁重,据说一次图灵需要去伦敦参加一个紧急会议,但一时没有车可以送他,于是他说了一句“我自己解决吧”,就拔腿奔跑而去。64千米的路对于他来说似乎毫不费力,会后他又自己跑了回来。图灵的长跑纪录是奥运会水平的,他本来想代表英国参加1948年的奥运会,但因为受了伤,只好放弃。

即使在战争中,图灵也没有放弃对机器与智能问题的思考。战后,他来到曼彻斯特大学任教。在朋友的催促下,他把他对机器与智能问题的思考写成了文章,这就是1950年他在英国哲学杂志《心》上发表的又一篇具有划时代意义的论文《计算机与智能》。在论文中,他提出了“模仿游戏”这个后来被人们称为“图灵测试”的人工智能的定义。该论文被公认为最早对人工智能进行系统化和科学化的论述。

“模仿游戏”很简单。两个封闭的房间里分别有一个人和一台机器,他们通过一个打字终端来回答屋子外面的人提出的问题。如果屋子外面的人不能通过提问判断两个房间里面回答问题的哪一个是人哪一个是机器,那么机器就被认为是有智能的。图灵不仅在论文中提出了“机器能思维吗”这个问题,而且提出了这个问题的各种变种;不仅给出了答案,而且预想了人们对于答案的可能异议以及对异议的反驳。他还进一步预测,2000年机器的内存会达到1GB。事实证明他的预测十分准确。

2011年, IBM公司的沃森超级计算机在美国的电视智力竞猜节目中击败人类,成为“图灵测试”里程碑式的证明,标志着人工智能的历史性飞跃。美国麻省理工学院的机器人专家布鲁克斯不无感叹地说道:“阅读图灵的文章,真是令人折服。他早就想到了这些玩意儿,没有人比他更先知。”

然而,图灵的聪明才智并没有让他的人生辉煌,他的个人生活一直困扰着他,还让他官司缠身。英国政府不但没有因为他在战时从事密码工作的贡献而保护他,反而吊销了他的安全许可,这意味着他从此没有办法在这个领域里工作。

1954年6月7日,他被发现死在自己家中的床上,年纪还不到42岁。关于他的死因,至今众说纷纭。为了纪念和表彰图灵对计算机科学的贡献,美国计算机学会于1966年设立了图灵奖,这是一个被称为“计算机科学界的诺贝尔奖”的最高专业奖项。2009年9月10日,图灵死后55年,在英国人民的强烈呼吁下,英国首相布朗面向全英国人民正式向图灵致歉。布朗说:“我很骄傲地说,我们错了,我们应该更好地对待你。”

图灵这个伟大的天才生时平凡,死时阴暗。像很多伟大的人物一样,他所有的荣誉和地位都是在他死后获得的。今天,在英国曼彻斯特公园里,图灵雕像的基座上刻着著名逻辑学家罗素的一句话:“数学不仅有真理,也有最高的美,那是一种冷艳和简朴的美,就像雕像。”图灵被认为是人类历史上最伟大的12位哲学家之一,和亚里士多德齐名。也许伟大、光荣其实并不重要,重要的是真和美;也许你是谁也不重要,重要的是你为人类做过什么贡献。图灵以他对人工智能理论空前绝后的卓越贡献而成为人工智能第一人。

2.2 冯·诺依曼和第一台电子计算机

虽然人工智能和计算机科学是两个不同的研究领域,但人工智能其实一直和计算机科学密不可分,毕竟电子计算机又被人们俗称为电脑,而人工智能的核心就是基于逻辑电子电路的各种各样的计算方法。计算机科学一直都有两条互相交错的路线,理论路线的起源是我们前面讲过的图灵,而工程路线则可以追溯到冯·诺依曼,一位匈牙利裔美国数学家,第一台电子计算机的发明者。他们共同关注的课题都是大脑和智能。

冯·诺依曼是20世纪最重要的数学家之一,在纯粹数学和应用数学方面都有杰出的贡献。他生前的名气比图灵大得不止一星半点,图灵申请奖学金的推荐信还是冯·诺依曼写的。他慧眼识英雄,老早就看出图灵与众不同,曾经挽留过刚毕业的图灵留在普林斯顿大学给他做助手。后来他一再说,自己发明的电子计算机的核心概念,除了来自巴贝奇的一些预见,其余全部来自图灵。当然,这是后话,况且发明电子计算机也不是他唯一的成就和贡献。

冯·诺依曼的职业生涯大致可以分为两个阶段。1940年以前,他主要从事纯粹数学的研究,在数理逻辑、集合论和量子理论方面都卓有建树;他还开拓了遍历理论的新领域,运用紧致群解决了希尔伯特第五问题,在测度论、格论和连续几何学方面做出过开创性的贡献。在1936年到1943年间,他和数学家默里合作创造了算子环理论,即所谓的冯·诺依曼代数。

1940年以后,冯·诺依曼进入了他职业生涯的第二个阶段,研究方向转向应用数学。如果说他的纯粹数学成就属于数学界,那么他在力学、经济学、数值分析和电子计算机方面的成就则属于全人类。第二次世界大战爆发后,冯·诺依曼因战事的需要开始研究可压缩气体的运动,建立冲击波理论和湍流理论,发展了流体力学。自1942年起,他同莫根施特恩合作,写作《博弈论和经济行为》一书。这是博弈论中的经典著作,使他成为数理经济学的奠基人之一。

冯·诺依曼发明电子计算机其实是一个巧合。第二次世界大战爆发后,冯·诺依曼就参加了美国研制原子弹的工作。在对核反应过程的研究中,要对一个反应的传播做出“是”或“否”的回答。解决这一问题通常需要通过几十亿次的数学运算和逻辑判断,为此他所在的洛斯阿拉莫斯实验室聘用了100多名女计算员,利用台式计算机从早到晚不停地计算,可还是远远不能满足需要。无穷无尽的数字和逻辑指令如同无底洞一样把人们的智慧和精力消耗殆尽,这让冯·诺依曼大伤脑筋。

1944年夏季的一天,正在火车站候车的冯·诺依曼巧遇了戈尔斯坦中尉。当时,戈尔斯坦中尉是美国弹道实验室的军方负责人,他正在参与当时主要由英国科学家负责的ENIAC计算机的研制工作。在交谈中,戈尔斯坦告诉冯·诺依曼,ENIAC计算机证明电子真空技术可以大大地提高计算技术。不过,ENIAC计算机存在两大问题:一是没有存储器,无论是计算过程还是计算结果都无法保存在计算机里,每次运算都要从零开始;二是它用布线接板进行控制,搭接工作甚至需要几天来完成,计算效率也就被这一工作抵消了。他们正在寻找解决这两个问题的方法,想尽快着手研制另一台计算机,以便改进其性能。具有远见卓识的冯·诺依曼突然眼前一亮,他意识到了这项工作的深远意义。

不久,冯·诺依曼就由戈尔斯坦中尉介绍参加了ENIAC计算机研制小组。1945年,在他的领导下,研制小组发布了一个全新的“存储程序通用电子计算机方案”(EDVAC)。在此过程中,冯·诺依曼显示出了他扎实的数理基础,充分发挥了他的顾问作用以及探索和综合分析问题的能力。冯·诺依曼以《关于EDVAC的报告草案》为题,起草了长达101页的总结报告。该报告广泛而具体地介绍了制造电子计算机和设计程序的新思想。这份报告是计算机发展史上的一份具有划时代意义的文献,它向世界宣告:电子计算机的时代开始了。

EDVAC方案明确了新机器由5部分组成,其中包括运算器、控制器、存储器、输入设备和输出设备,并描述了这5部分的功能和相互关系。在报告中,冯·诺依曼对EDVAC中的两大设计思想做了进一步的论证,为计算机的设计树立了一座里程碑。

设计思想之一是二进制,他根据电子元件双稳态工作的特点,建议在电子计算机中采用二进制。他在报告中提到了二进制的优点,并预言二进制的采用将大大简化机器的逻辑线路。冯·诺依曼提出的计算机基本工作原理奠定了现代电子计算机的基础,使他成为了“电子计算机之父”。

1903年12月28日,冯·诺依曼生于匈牙利布达佩斯的一个犹太人家庭。他的父亲是布达佩斯的一名银行家,母亲是一位善良的家庭妇女,贤惠温顺,受过良好的教育。

冯·诺依曼从小就显示出了数学和记忆方面的天分。在孩提时代,冯·诺依曼就有过目不忘的天赋。6岁时,他就能用希腊语同父亲互相开玩笑,还能通过心算做8位数除法。8岁时,他掌握了微积分。10岁时,他花费了数月时间读完了一部48卷的世界史,并且可以将当前发生的事件和历史上的某个事件进行对比,讨论两者的军事理论和政治策略。12岁时,他就读懂领会了数学家波莱尔的大作《函数论》。

在布达佩斯大学,他注册为数学系的学生,但他并不听课,只是每年按时参加考试,考试成绩还都是A。与此同时,他却跑到柏林大学去听课。1923年,他又进入瑞士苏黎世联邦工业大学学习化学,并在那里获得了化学工程学士学位。通过在每学期期末回到布达佩斯大学进行课程考试,他获得了布达佩斯大学数学博士学位。

1930年,他首次赴美,成为普林斯顿大学的客座讲师。善于汇集人才的美国政府不久就聘他为客座教授。1933年,普林斯顿高级研究院正式聘请他为教授。当时该研究院聘有6名教授,其中包括爱因斯坦,而年仅30岁的冯·诺依曼是他们当中最年轻的一位。

1955年夏天,X射线检查出他患有癌症,这多少可能和他参加原子弹研制工作有关。随着病情的发展,他只能在轮椅上继续思考、演说及参加会议。在病中,他接受了耶鲁大学西里曼讲座的邀请,但在讲座期间,他的身体太虚弱了,没法到现场。到他去世时,讲稿也没有完成。1957年2月8日,他在医院里逝世,享年53岁。

冯·诺依曼才华超群。在他去世的前几天,肿瘤已经占据了他的大脑,但他的记忆力还是不可思议地好。一天,他的同事、数学家乌拉姆坐在他的病榻前,用希腊语朗诵一本他特别喜欢的修昔底德的书,书中讲述亚丁人进攻梅洛思的故事和佩里莱的演说。他一边听一边不断纠正乌拉姆的错误和发音。冯·诺依曼死后获得了极高的评价,过人才华和众多成就让他成为了人类历史上迄今为止屈指可数的几位伟大的科学家之一。

2.3 冯·诺依曼和人工智能

冯·诺依曼是一位大师级人物,他在数学、理论物理和逻辑等众多领域做出了重大的贡献和影响,历史上很少有人能企及。他和众多大师级人物的往来与交流影响和改变了许多人,比如图灵、纳什和麦卡锡等。他对人工智能的贡献也远不止发明了世界上第一台电子计算机,今天我们热烈讨论的阿尔法狗、神经网络等都与冯·诺依曼有着千丝万缕的联系。

1948年9月,一个关于人类行为中脑机制的研讨会在美国加州理工学院召开。长期以来,科学家们一直对人脑的结构和思维机制抱有浓厚的兴趣,生物学家、解剖学家、心理学家和神经学家都努力在自己的研究领域中探索人类行为中的脑机制,试图揭开人类思维的奥秘。加州理工学院召开的这场研讨会就是科学家们关于这一主题的一次交流活动。

加州理工学院坐落在素有阳光之州称呼的加利福尼亚的洛杉矶市。9月的气候和西海岸的风光确实让这次会议十分吸引人,但更有吸引力的是会议上来的一位大人物,他就是冯·诺依曼。一场关于认知科学的研讨会似乎与计算机和数学没有太大关系,那么这位计算机界的大人物为什么来参会呢?

原来冯·诺依曼发明了第一台电子计算机以后一直有一个想法,那就是能不能发明一种具有足够的复杂性、在理论上能自我复制的机器——自动机?无疑他主创的电子计算机成为他思考的原型和出发点,但一种能自我复制的机器应该具有类似于人脑的机制,所以这场关于人类行为中脑机制的研讨会就引起了他的兴趣。他希望在计算机结构的基础上,开展可以接近人类大脑机制的人工自动机理论研究。

当时正在那里就读本科的约翰·麦卡锡恰巧也旁听了会议。这让他心潮澎湃,脑洞大开。后来他回忆说:“正是这次会议激发了我对人工智能的浓厚兴趣和研究欲望。”是冯·诺依曼影响了这位后来被称为人工智能之父的年轻人。

冯·诺依曼在这次会议上发表了题为《自动机的通用和逻辑理论》的演讲,开启了细胞自动机的理论研究。此后,他的助手伯克斯在余生中都没有离开过细胞自动机研究,还培养了世界上第一位计算机科学博士霍兰德。冯·诺依曼在细胞自动机和DNA方面的研究工作自然也间接地影响到了霍兰德。在他的博士论文中,霍兰德首次提出了一种新的人工智能算法——遗传算法。霍兰德的大弟子巴托尔和巴托尔的大弟子萨顿后来又发明了强化学习理论。强化学习理论被用在谷歌的阿尔法狗上,击败了几乎所有的围棋大师。该理论也被用在卡内基·梅隆大学的Libratu机器牌手上,赢得了得州扑克大赛。所以,毫不夸张地说,受生物学启发的人工智能研究的根在冯·诺依曼。

什么是细胞自动机呢?简单地说,细胞自动机就是为模拟包括自组织结构在内的复杂现象提供的一种强有力的方法。自然界里许多复杂的结构和过程,归根结底都是由大量的基本组成单元通过简单的相互作用所形成的。细胞自动机给出了这些基本组成单元的简单相互作用的关系。

为了理解细胞自动机,让我们看一个简单的例子。找一张画有许多格子的图纸,用铅笔将其中的一些格子涂黑后就可以得到一个图案。第一排也许有一个或几个格子被涂黑了,而一个简单的细胞自动机则通过确定某种简单的规则,从第二排开始往下画出新图案来。

具体到每一行中的每一个格子上,要观察其上一行中对应的格子及该格子两边的情况,然后根据这3个格子是否被涂黑以及黑白格子如何相邻的既定规则(比如,当这3个格子从左至右分别为黑、黑、白时,其正下面的格子为白,否则为黑),确定当前的格子是被涂黑还是留白。如此反复进行下去,一条或一组这样的简单规则及简单的初始条件就构成了一个细胞自动机。

细胞自动机理论主要研究由小的计算机或部件按邻域连接方式连接成较大的并行工作的计算机或部件的理论模型。

冯·诺依曼的工作还影响了计算机科学家沃尔夫勒姆。沃尔夫勒姆一直在研究细胞自动机,他的研究的副产品就是著名的数学软件Mathematica和搜索引擎Alpha。沃尔夫勒姆在其《新科学》一书中12次提到冯·诺依曼,而排名第一的是图灵,他被提及19次。

冯·诺依曼为人热情,殷勤好客。他有一所方便聚会的大房子,每当闲暇之余,他就呼朋唤友前来聚会。每次聚会,朋友们总是想要和这位天才“斗智斗勇”,其中发生了许多有趣的故事。有一次,冯·诺依曼与几位数学家聚餐,被他们一起用伏特加一通猛灌。终于,冯·诺依曼不胜酒力,摇摇晃晃地去厕所呕吐了。他从厕所回来后继续和朋友们讨论数学问题,思路还是异常清晰。朋友们面面相觑,感觉自己的智商完全被这位天才所碾压。

还有一次,他在宴会上和一位据称最了解拜占庭历史的历史专家发生了争执,争执源自冯·诺依曼对这位专家所描述的拜占庭历史的质疑。两人争得面红耳赤,各不相让。这时有人拿来了史学书籍,发现冯·诺依曼竟然一字不差地复述了书上的内容,这位历史专家只好闭嘴。不过,冯·诺依曼也表示,以后邀请这位拜占庭历史专家来聚会时,绝不再与其争论拜占庭历史。

冯·诺依曼逝世后,他的大作《计算机与人脑》才正式出版,书中预示了人工智能的发展路线。冯·诺依曼在不同场合都高度评价了图灵机和皮茨的神经网络。《计算机与人脑》的第一部分是“计算机”,第二部分是“大脑”,他把二者看成解决同一问题的两种方法。长期以来,人工智能研究领域就一直有符号学派和神经学派之分。符号学派就是计算机的代表,神经学派就是大脑的代表,他们各抒己见,互不相让。冯·诺依曼的《计算机与人脑》其实告诉大家,二者殊途同归,人工智能的两派应该互相倾听,互相学习,取长补短。

冯·诺依曼的故事是永远也讲不完的。

相关图书

ChatGPT与AIGC生产力工具实践 智慧共生
ChatGPT与AIGC生产力工具实践 智慧共生
专利写作:从创意到变现
专利写作:从创意到变现
产品经理方法论——构建完整的产品知识体系(第2版)
产品经理方法论——构建完整的产品知识体系(第2版)
程序员的README
程序员的README
架构思维:从程序员到CTO
架构思维:从程序员到CTO
开发者关系实践指南
开发者关系实践指南

相关文章

相关课程