Python深度学习

978-7-115-48248-8
作者: [英] 尼格尔·刘易斯(N.D. Lewis)
译者: 颛青山
编辑: 陈冀康

图书目录:

详情

本书是使用Python进行深度学习实践的一本初学指南。全书共9章,分别介绍了深度学习基础理论、神经网络基础知识、如何构建定制化深度预测模型、性能提升技术、二元分类的神经网络应用等领域,而且结合Python语言探讨了基本的算法和实现模型。

图书摘要

版权信息

书名:Python深度学习

ISBN:978-7-115-48248-8

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

著    [英] 尼格尔•刘易斯(N.D. Lewis)

译    颛青山

责任编辑 陈冀康

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315


Simplified Chinese translation copyright ©2018 by Posts and Telecommunications Press All Rights Reserved.

Deep Learning Step by Step with Python:A very Gentle Introduction to Deep Neural Networks for Practice Data Science by N.D Lewis.

Copyright © 2016 by N.D Lewis.

本书中文简体版由N.D Lewis授权人民邮电出版社出版。未经出版者书面许可,对本书的任何部分不得任何方式或任何手段复制和传播。

版权所有,侵权必究。


本书是使用Python进行深度学习实践的一本初学指南。本书并未罗列大量的公式,而是通过一些实用的实际案例,以简单直白的方式介绍深度神经网络的两项任务——分类和回归,解析深度学习模型中的一些核心问题,以期让读者对深度学习的全貌有一个清晰的认识。

本书共9章,分别介绍了深度学习基础理论、神经网络基础知识、构建定制化深度预测模型、性能提升技术、二元分类的神经网络应用等内容,并借助Python语言对基本算法和实现模型进行了探索。

本书适合期望用较短时间在深度神经网络领域初试牛刀的读者,也适合深度学习的初学者以及业内人士参考。


特别感谢:

我的妻子安琪拉,感谢她的耐心和不断的鼓励;

我的女儿狄安娜,感谢她为本书和我的网站拍摄了很多的照片;

还有我的早期图书的读者,他们提出了很多问题和建议。


随着深度神经网络越来越火,市面上涌现了许多相关的书籍和工具。这对于想要了解深度神经网络的读者是一件好事。但从哪本书开始呢?初学者显然希望有一本能浅显易懂地讲述深度神经网络相关内容的书,而不是一头扎到天书一般的数学公式中。

本书就是这样一本简单、直白的深度神经网络入门书籍。它用一些实用的实际案例来对深度神经网络的两项任务——分类和回归,进行非常简洁、精辟的介绍。读完本书,相信读者对深度学习的全貌以及深度学习模型中的一些核心问题,会有一个非常清晰的认识。

书中涉及少量的Python代码,因为Python代码本身非常容易理解,且非常简单,因此作者没有随书附带示例代码文件供读者下载。对于有一些编程经验的读者,强烈建议动手实践操作这些代码。我在翻译的过程中,将所有代码整理了一下,分享在异步社区。

希望读者也能和我一样,能从本书中收获快乐和知识。

颛清山 


本书旨在帮助读者掌握强大的深度神经网络工具。希望能帮助读者使用Python编程语言开发实用的应用。通过阅读本书,读者可以用最短的时间来学习、实践,并体验深度学习的强大工具。这些想法帮助了我以及成千上万的人,希望也能帮助读者加速数据科学实践。最后,我希望本书能让成千上万的读者轻松地掌握深度学习的工具。

本书收集了实用的工具、先进的理念和技巧,初学者可以借助Python进行深度神经网络的快速开发。本书的目标是帮助读者在尽可能短的时间内获得实用的知识,开发性能优异的模型,并改善模型的效率。本书重点介绍了一些有用的方法,读者可以很容易理解并快速实现。基于此,本书详细讲解了以下内容:

深度学习是数据科学中最激动人心的课题之一。它产生过令人惊异的结果,有相当出色的表现。它充满着很多伟大的想法——从搜索引擎、语音识别系统、自动驾驶汽车到生成爵士乐。深度学习是一门充满可能性的学科。想象一下如何把它运用在自己的数据科学项目上,哪怕是一个令人难以置信的想法,但这种可能性是多么令人激动啊——至少我希望你是如此。

除了渴望了解前沿预测技术外,还有其他一些原因需要掌握深度学习。例如,假设受过传统线性模型训练的数据科学家顾问,面临着很差的预测性能、最终报告的压力和紧迫的最后期限。如果他在本书中学会运用深层神经网络的工具,将能够更好地提高成功率。无论走到哪里,他都会因自己的数据科学工具包中有前沿深度学习技术而信心百倍。真正令人惊奇的是,有一点知识后,这些工具很容易使用。

读者不需要是一个天才的统计学家或者编程“大牛”,就能够理解并从本书讨论的实用想法和解决方案中获益。如果读者使用过统计工具包,或者有任何一门简单编程语言的经验,就能轻松、快速地掌握本书中讨论的技术。本书用平实的语言讲解深度神经网络,即使读者从来没有学过线性代数,不想看任何推导公式,也不喜欢复杂的计算机代码,也能轻松理解。读者从本书中得到的想法和实际信息适用于小型广告公司工作的个人数据科学家,适用于某区域宠物食品公司由3位决策科学家组成的团队,也同样适用于完成数据科学项目课程作业的学生或参与当地卫生当局的预测项目独立顾问。

对大多数人来说,生活是忙碌的,总是没有足够的时间学习知识。人们被个人和家庭的义务、学习、考试、工作、健身计划、数不清的邮件、项目、工作的截止期限所包围,更不用说充斥着日常生活的社交活动和数不清的杂事。有这么多的事情分心,又从哪里找时间来掌握深度学习呢?

这就是我写本书的初衷。它是一本动手实践的、容易理解和实用的指南,通过Python带读者领略数据科学家在深度神经网络中用到的成功的想法、出色的技术和可用的解决方案。本书关注于“怎么做”,正如本杰明·富兰克林1的名言:

1另一种说法是此出于《荀子·儒孝》——译者注

 

“告诉我,我会忘记;教给我,我会记住;让我一起实践,我才会懂得。”

循序渐进地每天从本书中学习一点,几周后,读者便会惊讶于自己的进步。随着练习的持续推进,你对所学知识的理解会不断加深。说不准,因为这一点点耐心、坚持和练习,读者能成为所在团队的深度学习专家,付出就有收获。

随着Python的兴起,实践深度学习也变得非常容易。本书循序渐进地展示了如何使用免费并且流行的Python编程语言构建每一种模型。书中的示例代码非常清晰,可供读者直接输入Python代码段中。

如果读者完全不懂Python,不妨看一下不错的入门教程——https://www.python.org/about/gettingstarted/。这是为Python初学者准备的,是一个相当不错的教程。

建议读者每天至少学完本书的一节内容,然后和朋友、同事、学生或者任何其他对数据应用深度学习模型感兴趣的人讨论。阅读图解说明,输入Python代码示例并阅读每一章后面的附注。坚持记录关于数据科学的想法,并一点一点地把所学到的东西糅合到自己的数据科学项目中。

深度学习完全关于真实的生活、真实的人,也是把机器学习算法用于真实世界的问题以得到有效解决方案的应用。不管你是谁,不管你来自哪里,不管你的背景和学历如何,你都有能力掌握本书列出的想法。我个人坚信,借助合适的软件工具,加上些许坚持和正确的指导,只要有兴趣,你一定能成功地掌握并使用深度学习方法。

希腊哲学家伊壁鸠鲁曾说:

“这是为你而写,而不是其他人。有你互为听众,足矣。”

虽然会有成千上万的人接触到本书中的想法,但我尽力牢记伊壁鸠鲁的原则——让书中的每一页都只对你,是有意义的。

读完本书后,读者能够在自己特别感兴趣的领域实现本书中提及的一个或多个想法。读者会惊奇地发现使用这些技术和用Python进行部署是多么简单、快捷。经过几次不同的运用,读者很快就会成为一名熟练的从业者。


本书由异步社区出品,社区(https://www.epubit.com/)为您提供相关资源和后续服务。

这本书只提供彩图文件和本书提供如下资源:

要获得以上配套资源,请在异步社区本书页面中点击 ,跳转到下载界面,按提示进行操作即可。注意:为保证购书读者的权益,该操作会给出相关提示,要求输入提取码进行验证。

作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎您将发现的问题反馈给我们,帮助我们提升图书的质量。

当您发现错误时,请登录异步社区,按书名搜索,进入本书页面,点击“提交勘误”,输入勘误信息,点击“提交”按钮即可。本书的作者和编辑会对您提交的勘误进行审核,确认并接受后,您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。

我们的联系邮箱是contact@epubit.com.cn。

如果您对本书有任何疑问或建议,请您发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。

如果您有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区在线提交投稿(直接访问www.epubit.com/selfpublish/submission即可)。

如果您是学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。

如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接发邮件给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。

关于异步社区和异步图书

“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT技术图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT技术图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https://www.epubit.com。

“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书的品牌,依托于人民邮电出版社近30年的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的LOGO。异步图书的出版领域包括软件开发、大数据、AI、测试、前端、网络技术等。

异步社区

微信服务号


 

投资知识,收益最佳。

——本杰明·富兰克林

我希望读者能在最短时间内从本书中获得最大的收益。这可以通过输入示例代码、阅读参考文献并进行试验来达成。通过大量的示例和阅读参考文献,你能够拓宽知识面,加深你原有的对深度学习的一些直观理解,强化你的实践技能。

你至少有两种方式来使用这本书。首先,可以把它作为一本高效的参考书。翻阅到需要的章节,快速查看是如何用Python进行计算的。为了使收获最大化,你最好能够输入书中的代码,检查结果,然后根据自己的数据调整样本。其次,可以通过浏览真实的示例、图表、案例研究、技巧和说明来激发你自己的想法。本书既介绍了总体思路,同时也介绍了一些深度学习相关的历史、案例研究和文献。

要使用本书,需要下载Python。目前,Python有两个主要的版本——Python 2.7 和Python 3。虽然Python 3在几年前就诞生了,但Python 2.7使用得更广泛,而且目前仍然是数据科学领域所用的流行版本1。本书示例使用Python 2.7编写。你可以从Python官方网站下载Python 2.7。

1Python 3是趋势,目前大多数数据科学库同时支持Python 2和Python 3。如果可能的话,建议尝试使用Python 3,但本书除外。——译者注

推荐的Python变体版本有很多,许多数据科学家使用Anaconda Python发行版。在其中预打包了许多在数据分析和统计建模中使用的核心软件模块。PyPy变体使用即时编译来加速代码的运行,因此能非常快地运行深度学习的代码。对于Windows用户来说,WinPython是运行Python的简单方式,它省去了安装的麻烦2

2Anaconda Python也是Windows下的一个不错的选择。——译者注

Python是一门强大的编程语言,易于初学者使用和学习。如果你有任何编程语言的经验,就能很快地掌握Python。如果你对编程语言一无所知,或者已经很长时间不使用,下面这些免费的资源可以让你快速上手。

另外,请务必访问Python软件基金会官网,那里有最新的新闻和技巧窍门。

高效地使用Python需要用到叫作“包”的软件模块。本书中,我们会用到一些软件包。如果你的计算机中没有本书中提到的软件包,请下载并进行安装1

你不需要读完本书就可以把书中的想法融入自己的分析中。你可以随学随用,也可以直接阅读感兴趣的章节,并立即在自己的研究和分析中进行测试、创建和开发。下面是本书的一个概述,能帮助你开启本书的阅读之旅。

本书是深度神经网络的入门和上手实践的手册。更确切地说,本书力求为你提供使用Python简单、快速地构建深度神经网络所需的工具。其目标是提供给你必要的工具来完成工作,并提供足够的图解说明来帮助你思考在你感兴趣的领域的深度学习相关的应用。我希望这个过程是愉快并且有收获的。

其他资源

关注数据科学的Python用户组遍布世界各地,请找到并加入本地的用户组。你可以从如下资源开始学习。

如果你在自己的专业领域成功应用了深度神经网络,请告知我。我很乐意收到你的来信,请发送邮件到info@NigelDLewis.com。

1.访问Python的维基页面获取详细的步骤。


 

好奇心是学习这根蜡烛的灯芯。

——威廉·亚瑟·沃德

读小学时,我的老师马斯特斯女士教给我和同学们“视角”的概念。有4个志愿者参与到一个非常有趣的实验中。在这个实验中,每位志愿者都被蒙住眼睛,并被领着走到一头很大的驴的模型面前。第一个学生被带到驴尾巴的地方,然后被要求描述她摸到的东西是什么样子。接着第二个学生被带到驴腿的地方,也被要求描述摸到的东西是什么样子。剩下的每个学生都被带到驴的不同部位,每个人都描述了他们认为的样子。

因为这些蒙住眼睛的学生都没有全部的信息,他们凭感觉对驴的描述大相径庭。我们对他们的荒唐描述大笑不止。很明显,驴就是驴,怎么可能是其他的样子。当这些同学摘下眼罩后,他们也不禁大笑起来。马斯特斯真是一位好老师。

打个比方说,在本章我将为你绘制一张完整的“驴”。我将概述深度学习、介绍一些主要的成员,接触一些已经应用深度学习的领域,并说明为什么你应该把它添加到自己的数据科学工具箱中。

2016年年初,传奇的围棋棋手李世石与一个围棋界的“新手”开始了一系列举世瞩目的较量。

围棋是一种棋盘类游戏,于2500年前发源于中国。它是一种比国际象棋更为复杂的策略游戏,全球有75个国家的选手积极地参与其中2

李世石,围棋九段棋手,从2002年起多次获得世界冠军。他面对的是一个看不见的敌手——AlphaGo。AlphaGo是由伦敦的谷歌DeepMind团队开发的。不知道李世石在赛前对他的对手了解多少,也许他从科学作家马修·布拉加的关于围棋的文章中得到了安慰。该文章于2014年发表,其中谈到了围棋3

“……是少数几种计算机智能尚未掌握的游戏之一。该游戏有着太多的可能的走法,让程序员长期以来陷入僵局。”

但在数据科学领域,24个月已经是一段相当长的时间了。谷歌的深度学习算法可以打败优秀的计算机对手,甚至是在让对手四子先手的情况下。2016年1月,AlphaGo曾以5:0的比分完胜欧洲冠军樊麾。2016年3月,AlphaGo挑战传奇选手李世石。

在最后一子落下之前,胜负已经十分明了。法国著名媒体机构CAUSEUR尖叫4:“李世石感到羞耻的一天。”震惊的九段冠军挣扎着讲述他被数学算法打败5

“……我应该表现得更好,应该有更好的结果以及更好的比赛过程。我为没能满足很多人的期望而道歉。我有些无能为力。”

李世石仅仅是另一个在人机对战中被高度关注的选手。人机对战的历史可以追溯到约翰·亨利和新技术蒸汽钻那场史诗般的对战。在那场无限制的比赛中,双方表现得旗鼓相当,最终亨利获胜,但不久就因虚脱而死。随着铁路蜿蜒穿越整个美国,蒸汽钻成了必不可少的工具。深度学习之于李世石如同蒸汽钻之于约翰·亨利。

奇怪的是,对于那些以建立专家模型为生的人,从神经网络和其他来自机器学习的高度技术中获益是显而易见的。实际上(与理论猜测相反),深度学习的惊人成果受到了商界、政府机构、研究界以及越来越多的学者的高度重视。正如一位学者所说6

“20 世纪90 年代,经验主义的复兴是一个激动人心的时刻。我们从来没有想到,我们的努力会如此成功。当时,我们想要的只不过是一席之地而已。在当时流行的各项研究之外,我们所想的只是为不同于当时其他研究的工作争取一点空间。”

还记得那个古老的笑话吗?世界上有两类人——一类人相信世界上有两类人,而另一类人完全不相信前一观点。好吧,我确实相信世界上有两种数据科学家。我并不是在说那些学习计算机科学的数据科学家和那些学习统计学的数据科学家。任何称职的数据科学家都可以在需要概率、统计、数据结构和算法的时候信手拈来。实际上,本书中的建议同样适用于这两个学科的数据科学家,我们也会看到对两者都有很大好处的例子。

我也不是在谈论机器学习狂热分子与传统统计建模的数据科学家。经典的统计建模和由现代机器学习开发的算法在识别和利用数据集的重要特征方面都起着重要的作用。本书将帮助你更好地理解这两种方法,并将它们更有效地结合到分析数据集中。

我甚至谈论的也不是具有专门领域知识的数据科学家和那些通才的数据科学家。在一个学科深入进去并精通,是会有很好的回报的;灵活地跨越多个学科之间需要非凡的天分,也会是收获颇丰的。本书会在这两个方面帮助到你。

好吧,我认为世界上的两种数据科学家是具备深度学习技术知识的和不具备深度学习技术知识的。我不是说那些缺乏这些知识的人就比他们当代的同行们不专业。简单来说,深度学习的知识能让你接触到更广范围的工具,能从不同的角度解决具有挑战性的问题,并能快速有效地得出解决方案。简而言之,深度学习扩展了你的数据科学工具包。

说明

 

一位数据科学家,如果对深度学习优秀的方法知之甚少,那么与具有该技能的同事相比,这会是一个非常显著的缺点。从衰老研究到动物学分析,对深度学习技能的需求都是非常高的7

深度学习是机器学习与神经网络、人工智能、图形化建模、优化、模式识别和信号处理等技术融合后产生的一个领域。在严谨的学术期刊中,这个新兴学科的模型一直受严肃理智的学者所推崇8

“深度学习网络是神经网络革命性的发展,人们甚至认为可以用它来创建更强大的预测模型。”

简单来说,深度神经网络是一种用多层抽象来表示概念或特征的方式。其实,任何工程师或者建筑师都在用这种基本方法。想想大型办公楼的蓝图:在最底层,会标示出电路、水管和排水系统的详细情况;而在最高层,可能会有一个旋转观景台和旗杆,能看到整个30层楼的轮廓。

深度神经网络也遵循这个非常有用的方案。该方案几乎被用于生活的各个领域。医生有诊断书,教师有教学大纲,企业有盈利策划书,甚至学术界都有一个发表研究论文的规范。

实际上,在生活中很难找出不用多层抽象来表达观点的例子——军队指挥官用相同的原则部署作战,政治家以此赢得竞选。相同的原理同样适用于神经网络或者其他多层模型的分类和预测,这是毫无道理的。

说明

 

更快的计算机处理器,日益廉价的内存以及层出不穷的新数据格式,使得任意规模的企业都能用深度学习来做数据分析。

深度学习使用多层机器学习模型对数据进行有监督学或无监督学习。模型中的不同层由非线性数据变换的多个阶段组成,数据的特征在相继更高、更抽象的层表示。

说明

 

数据科学领域有如下两种基本的学习类型。

  • 有监督学习:训练的数据包含已知的结果。模型相对于这些结果进行训练。

  • 无监督学习:训练数据不包含任何已知的结果。算法自行发现数据中的联系。

在学习深度学习的核心思想时,我们采取的通用方法一般如图2.1所示。无论开发什么类型的机器学习模型,最终都回归到这个基本模型。输入数据传递给模型,经过多个非线性层进行过滤,最后一层包含分类器——决定该对象所属的种类。

图2.1 通用深度学习框架

用数据进行学习的目标是预测响应变量或者用一组给定的属性对响应变量分类。这与线性回归有点类似,在线性回归中,用一组独立变量(也叫属性或特征)通过一个线性模型来预测因(响应)变量。不过,传统的线性回归模型并不被视为深度学习,因为它们没有对数据进行多层的非线性变换。

其他流行的数据学习技术有决策树(decision tree)、随机森林(random forest)和支持向量机(support vector machine)。这些技术虽然强大9,但是并不深入。决策树和随机森林工作在原始输入数据上,不进行变换,也不生成新特征;支持向量机层次较浅,因为它们仅由核函数和线性变换组成。类似地,单隐藏层神经网络也不被视为深度神经网络,因为它们只包含一个隐藏层10

深度学习的威力来自于用适量的并行非线性步骤对非线性数据进行分类或预测的能力11。从原始输入数据到数据的实际分类的过程中,深度学习模型学习输入数据的分层特征。每一层从前一层的输出中提取特征。

本书所指的深度学习模型是有多个隐藏层的神经网络。如图2.2所示,最简单的深度神经网络至少包含两层的隐藏神经元。其中每一层的输入来自上一层的输出12

图2.2 带两个隐藏层的前馈神经网络

多层深度神经网络有多个非线性层级,可以紧凑地表示高度非线性的和/或高度变化的函数。它们擅长识别数据中的复杂模式,可以用来改进计算机视觉和自然语言处理等工作,并可以解决非结构化数据难题。

说明

 

全球发行且读者众多的杂志《IEEE Spectrum》13报道14:“数据科学家供不应求。这些专业人士享有高薪和大型股票期权……”据麦肯锡全球研究所称,仅美国就缺少14万~19万具备适当技能的数据科学家15。哈佛商业评论声称数据科学是21世纪最吸引人的工作16

深度学习技术正商业化地应用在医疗保健行业、医学图像处理17、自然语言处理和提高广告点击率等领域。微软、IBM、雅虎、Twitter、百度、PayPal和Facebook都在运用深度学习来了解用户的偏好,以便能推荐针对性的服务和产品。深度学习无处不在,甚至用在智能手机上来支持语音辅助技术。

很难想出一个不能从深度学习受益的商业活动。思考5分钟,把你一些最好的想法列下来。

这是我想到的领域列表:

说明

 

Richard Socher写下了自己的列表,从中找到了一个有用的应用,与他人联合创立了MetaMind。该公司专门从事医学图像分析和自动图像识别。其他数据科学家、企业家、应用研究人员,甚至可能是你,将会跟随Richard的脚步进入这个日益增长的利润空间。

有一天,我从一个科研机构获得一篇新闻稿,其中有一则新奇的消息——发生了一件极具吸引力的事情,其中涉及深度学习。这则新闻报道涉及美容行业,该行业每年有超过2600亿美元的全球市场。

美容产品的核心在于保持青春——逆转衰老。在世界各地,这一承诺反映在人们每年每天花费在市场营销的数百万美元上。充满青春活力、成熟快乐人士的形象广告充斥着人们的手机、平板电脑和笔记本电脑。

无论你在什么时候碰巧读到本书,都会有一个承诺永葆青春的新美容产品刚刚发布。不信你去看看,快速地在网上搜索一下……

有史以来,衰老的挑战一直是伟大思想家、政治家和科学家关注的前沿。早期美国老年学家I.L. Nascher在他的经典著作中写到29

“为什么人会变老,或者为什么经过一段时间的身体机能完美后,器官和组织会退化,其功能变弱并病变,直到它们无法维持生命所必需的、和谐的相互关系,这个问题是生与死这一伟大问题的一部分。”

直到1601年,英国伊丽莎白女王宣布的《济贫法》使这一问题有所缓解,被遗弃的老人因无工作能力穷困无依的困境,是制定该法律的一个关键问题:

“……维持秩序,为国家的福祉做出贡献。”

《济贫法》要求儿女赡养他们的父母和祖父母,因为I.L.Nascher观察到:

“在中国有敬奉祖先和老人的精神,但在我们这里没有。”

《济贫法》在英国持续了250多年。在这段时间里,英国人的预期寿命从约40岁翻了一番,超过了80岁。其他国家也有类似的趋势。

预期寿命的稳步上升有很多原因。临床外科专家Victor Horsley爵士将衰老归因于甲状腺的退化;著名科学家Elie Metchnikoff提出“吞噬作用”的理论——大肠白细胞破坏加速老化的细菌;著名的老年学家Shock博士在一次激烈的讨论中大胆地宣称30

“或许老年医学研究最有用的贡献之一就是证明衰老不一定与退化和疾病有关。”

衰老问题依然存在无数理论,生物学家、老年学家和人口学家之间存在巨大的分歧。衰老是一种疾病吗?人类的寿命是有限的吗?衰老可以停止甚至反转吗?

一则新的消息引起了我的注意,因为它说到,深度学习很可能一劳永逸地解决衰老这个问题。由青年实验室联合创始人Alex Zhavoronkov带领的研究人员进行了一项研究,旨在确定与衰老相关的一组生物指标31。一旦成功,这些指标便可以用来有针对性地长期跟踪干预治疗的有效性。这项研究一个令人震惊的地方便是——它仅需进行基本的血液检测。

研究人员开发了一套深度神经网络来预测实际年龄。它用超过60 000个样本进行训练。研究人员惊奇地发现,该系统确定了5个核心的生物指标32,预测精度达81.5%33

这个非常新颖且颇具开拓性的分析发表在世界著名的研究杂志上。该研究结果极具价值,研究人员也受邀参加世界美容创新峰会——深度学习进军美容行业了。

说明

 

深度学习需要专业的数据科学人才,而这些人才仍供不应求。目前只有屈指可数的少数公司能从深度学习中获益,其他企业正在迎头赶上。

深度学习已经成为迄今为止使用人工智能构建解决现实世界问题的系统的有效方法之一。互联网时代产生的海量数据正越来越多地被应用在深度学习中。正如记者Robin Wigglesworth在《金融时报》中写到34

“简单来说,深度学习建立在20世纪90年代神经网络发展的基础上,机器使用人造神经元矩阵扫描信息,寻找模式并做出决策,很像人脑的运作模式,但速度超快。”

深度学习在需要分类和/或预测的领域非常有用。在商业、工业或者研究的任何领域,任何对预测和分类问题感兴趣的人都应该学习深度学习。实际上,如果有足够的历史数据、需要预测或分类的研究案例,便可以构建一个深度学习模型进行研究。

要学习一个新的东西,最难的事情就是找到容易理解和部署的例子。找到课题相关的大量技术论文非常容易,但找到入门学习并快速搭建的具体的例子是很难的。本书就是为了解决这个问题。书中有直观的插图、实用的例子以及对模型的简单解释,这些可以用Python直接搭建和测试。这样就很容易上手,通过数据和Python进行试验。

运用本书中的想法将改变你的数据科学实践思维。即使仅实践了本书每章中的一个想法,你也不仅可以使用深度学习完成任务,还将能游刃有余地面对更多数据的机会和挑战。

在本章中,我们概述了数据科学家掌握深度学习知识和技能的重要性,回答了“什么是深度学习”的问题,并概述了深度学习可以解决的问题的本质。我们也了解了深度学习技术的主要用户,以及简单掌握深度学习知识和技术的途径。

在下一章中,我们将快速地介绍神经网络的基础。如果你以前从未用过神经网络(或者需要复习一下),可以阅读该章。它涉及了重要的方面,但不会让你陷入数学的细节中。

2.如果想学习围棋请上网查找相关教程。

3.参见《Solving Go, a Game More Complex than chess》一文。

4.参见CAUSE官网。

5.更多相关内容请参考相关报道。

6.参见这篇精彩的论文,它能把你的经验数据应用于更广的背景中,这会对你选择模型有帮助。Church, Kenneth. “A pendulum swung too far.” Linguistic Issues in Language Technology 6.5 (2011): 1-27.

7.这里有对该情况的一些比较典型的评论。

8.参见Spencer, Matt, Jesse Eickholt, and Jianlin Cheng. “A Deep Learning Network Approach to ab initio Protein Secondary Structure Prediction.” Computational Biology and Bioinformatics, IEEE/ACM Transactions on 12.1 (2015):103-112.

9.如果你想学习这些和其他数据科学技术,以及如何在R语言中使用它们,请访问www.auscov.com获取Applied Predictive Modeling Techniques in R。

10.为了获取更多关于使用R语言构建神经网络的信息,请查找Build Your Own Neural Network TODAY!

11.同样,深度神经网络架构可能比浅层网络更有效(就拟合参数而言),参见示例: Y. Bengio, Y. LeCun, et al. Scaling learning algorithms towards ai. Largescale kernel machines, 34(5), 2007.

12.参见以下资料。

13.IEEE是全球最大的专业杂志之一,致力于工程和应用科学。它在全球有超过400 000位会员。

14.参见 Emily Waltz的报道《Is Data Scientist the Sexiest Job of Our Time?》,IEEE Spectrum(2012年9月)。

15.参见 James Manyika、Michael Chui、Brad Brown、Jacques Bughin、Richard Dobbs、Charles Roxburgh和Angela Hung Byers的专题报道《Big data: The next frontier for innovation, competition, and productivity》. McKinsey Global Institute(2011年5月).

16.参见 Davenport, Thomas H., and D. J. Patil. “Data Scientist: The Sexiest Job of the 21st Century-A new breed of professional holds the key to capitalizing on big data opportunities. But these specialists aren’t easy to find—And the competition for them is fierce.” Harvard Business Review(2012): 70.

17.请自行查阅。

18.参见如下示例。

(1)Shaw, Andre M., Francis J. Doyle, and James S. Schwaber. “A dynamic neural network approach to nonlinear process modeling.” Computers & chemical engineering 21.4(1997): 371-385.

(2)Omidvar, Omid, and David L. Elliott. Neural systems for control. Elsevier, 1997.

(3)Rivals, Isabelle, and Léon Personnaz. “Nonlinear internal model control using neural networks: application to processes with delay and design issues.” Neural Networks, IEEE Transactions on 11.1(2000): 80-90.

19.参见如下示例。

(1)Lisboa, Paulo JG. “A review of evidence of health benefit from artificial neural networks in medical intervention.” Neural networks 15.1(2002): 11-39.

(2)Baxt, William G. “Application of artificial neural networks to clinical medicine.” The lancet 346.8983(1995): 1135-1138.

(3)Turkoglu, Ibrahim, Ahmet Arslan, and Erdogan Ilkay. “An intelligent system for diagnosis of the heart valve diseases with wavelet packet neural networks.” Computers in Biology and Medicine 33.4(2003): 319-331.

20.参见如下示例。

(1)Khoury, Pascal, and Denise Gorse. “Investing in emerging markets using neural networks and particle swarm optimisation.” Neural Networks (IJCNN), 2015 International Joint Conference on. IEEE, 2015.

(2)Freitas, Fabio D., Alberto F. De Souza, and Ailson R. de Almeida. “Prediction-based portfolio optimization model using neural networks.” Neurocomputing 72.10(2009): 2155-2170.

(3)Vanstone, Bruce, and Gavin Finnie. “An empirical methodology for developing stock market trading systems using artificial neural networks.” Expert Systems with Applications 36.3(2009): 66686680.

21.参见如下示例。

(1)Rogers, Steven K., et al. “Neural networks for automatic target recognition.” Neural networks 8.7(1995): 1153-1184.

(2)Avci, Engin, Ibrahim Turkoglu, and Mustafa Poyraz. “Intelligent target recognition based on wavelet packet neural network.” Expert Systems with Applications 29.1(2005): 175-182.

(3)Shirvaikar, Mukul V., and Mohan M. Trivedi. “A neural network filter to detect small targets in high clutter backgrounds.” Neural Networks, IEEE Transactions on 6.1(1995): 252-257.

22.参见如下示例。

(1)Vannucci, A., K. A. Oliveira, and T. Tajima. “Forecast of TEXT plasma disruptions using soft X rays as input signal in a neural network.” Nuclear Fusion 39.2(1999): 255.

(2)Kucian, Karin, et al. “Impaired neural networks for approximate calculation in dyscalculic children: a functional MRI study.” Behavioral and Brain Functions 2.31(2006): 1-17.

(3)Amartur, S. C., D. Piraino, and Y. Takefuji. “Optimization neural networks for the segmentation of magnetic resonance images.” IEEE Transactions on Medical Imaging 11.2(1992): 215-220.

23.参见如下示例。

(1)Huang, Zan, et al. “Credit rating analysis with support vector machines and neural networks: a market comparative study.” Decision support systems 37.4(2004): 543-558.

(2)Atiya, Amir F. “Bankruptcy prediction for credit risk using neural networks: A survey and new results.” Neural Networks, IEEE Transactions on 12.4(2001): 929-935.

(3)Jensen, Herbert L. “Using neural networks for credit scoring.” Managerial finance 18.6(1992): 15-26.

24.参见如下示例。

(1)Potharst, Rob, Uzay Kaymak, and Wim Pijls. “Neural networks for target selection in direct marketing.” ERIM report series reference no. ERS-2001-14-LIS(2001).

(2)Vellido, A., P. J. G. Lisboa, and K. Meehan. “Segmentation of the on-line shopping market using neural networks.” Expert systems with applications 17.4(1999): 303-314.

(3)Hill, Shawndra, Foster Provost, and Chris Volinsky. “Networkbased marketing: Identifying likely adopters via consumer networks.” Statistical Science(2006): 256-276.

25.参见如下示例。

(1)Waibel, Alexander, et al. “Phoneme recognition using time-delay neural networks.” Acoustics, Speech and Signal Processing, IEEE Transactions on 37.3(1989): 328-339.

(2)Lippmann, Richard P. “Review of neural networks for speech recognition.” Neural computation 1.1(1989): 1-38.

(3)Nicholson, Joy, Kazuhiko Takahashi, and Ryohei Nakatsu. “Emotion recognition in speech using neural networks.” Neural computing & applications 9.4(2000): 290-296.

26.参见如下示例。

(1)Kimoto, Tatsuya, et al. “Stock market prediction system with modular neural networks.” Neural Networks, 1990., 1990 IJCNN International Joint Conference on. IEEE, 1990.

(2)Fernandez-Rodrıguez, Fernando, Christian Gonzalez-Martel, and Simon Sosvilla-Rivero. “On the profitability of technical trading rules based on artificial neural networks: Evidence from the Madrid stock market.” Economics letters 69.1(2000): 89-94.

(3)Guresen, Erkam, Gulgun Kayakutlu, and Tugrul U. Daim. “Using artificial neural network models in stock market index prediction.” Expert Systems with Applications 38.8(2011): 10389-10397.

27.参见如下示例。

(1)Chung, Yi-Ming, William M. Pottenger, and Bruce R. Schatz. “Automatic subject indexing using an associative neural network.” Proceedings of the third ACM conference on Digital libraries. ACM, 1998.

(2)Frinken, Volkmar, et al. “A novel word spotting method based on recurrent neural networks.” Pattern Analysis and Machine Intelligence, IEEE Transactions on 34.2(2012): 211-224.

(3)Zhang, Min-Ling, and Zhi-Hua Zhou. “Multilabel neural networks with applications to functional genomics and text categorization.” Knowledge and Data Engineering, IEEE Transactions on 18.10(2006): 1338-1351.

28.参见如下示例。

(1)Maes, Sam, et al. “Credit card fraud detection using Bayesian and neural networks.” Proceedings of the 1st international naiso congress on neuro fuzzy technologies. 2002.

(2)Brause, R., T. Langsdorf, and Michael Hepp. “Neural data mining for credit card fraud detection.” Tools with Artificial Intelligence, 1999. Proceedings. 11th IEEE International Conference on. IEEE, 1999.

(3)Sharma, Anuj, and Prabin Kumar Panigrahi. “A review of financial accounting fraud detection based on data mining techniques.” arXiv preprint arXiv:1309.3944(2013).

29.如果你有时间并且有兴趣可以阅读整本书,这本书很有启发性,有很多有用的信息。参见Nascher, Ignatz Leo. Geriatrics: The diseases of old age and their treatment, including physiological old age, home and institutional care, and medico-legal relations. P. Blakiston’s Son & Company, 1914.

30.Shock博士有着令人震惊的独特见解。他的工作对人类知识做出了很大的贡献。他的论文非常值得一读。参见Shock, Nathan W. “The role of research in solving the problems of the aged.” The Gerontologist 1.1(1961): 14-16.

31.阅读该论文你将很有收获。它是深度学习应用在真实世界的一个经典案例。参见 Putin, Evgeny, et al. “Deep biomarkers of human aging: Application of deep neural networks to biomarker development.” Aging 8.5 (2016).

32.它们是白蛋白、葡萄糖、碱性磷酸酶、尿素和红细胞。

33.你可以在相关网站上测试自己的模型。

34.参见文章Money managers seek AI’s“deep learning”Robin Wigglesworth. Financial Times. 20th May 2016.


相关图书

ChatGPT原理与应用开发
ChatGPT原理与应用开发
动手学机器学习
动手学机器学习
机器学习与数据挖掘
机器学习与数据挖掘
机器学习公式详解 第2版
机器学习公式详解 第2版
自然语言处理迁移学习实战
自然语言处理迁移学习实战
AI医学图像处理(基于Python语言的Dragonfly)
AI医学图像处理(基于Python语言的Dragonfly)

相关文章

相关课程