不只是美:信息图表设计原理与经典案例

978-7-115-37089-1
作者: 【美】Alberto Cairo
译者: 罗辉李丽华
编辑: 王峰松

图书目录:

详情

全面揭开信息图的神秘面纱,帮助读者从信息图的实际应用提升到理论认知。通过本书对信息图表的介绍,你将学会如何利用这种图表工具挖掘数据背后的信息,并对这个复杂的世界产生新的见解。随书附赠DVD光盘,包含超过90分钟的视频课程讲解数据可视化。

图书摘要

版权信息

书名:不只是美:信息图表设计原理与经典案例

ISBN:978-7-115-37089-1

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

• 著    [美]Alberto Cairo

  译    罗 辉 李丽华

  责任编辑 王峰松

• 人民邮电出版社出版发行  北京市丰台区成寿寺路11号

  邮编 100164  电子邮件 315@ptpress.com.cn

  网址 http://www.ptpress.com.cn

• 读者服务热线:(010)81055410

  反盗版热线:(010)81055315


Authorized translation from the English language edition, entitled FUNCTIONAL ART, THE: AN INTRODUCTION TO INFORMATION GRAPHICS AND VISUALIZATION, 1st Edition, 9780321834737 by CAIRO, ALBERTO, published by Pearson Education, Inc, publishing as New Riders, Copyright © 2013 by Alberto Cairo.

All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage retrieval system, without permission from Pearson Education, Inc. CHINESE SIMPLIFIED language edition published by POSTS AND TELECOMMUNICATIONS PRESS, Copyright © 2014.

本书中文简体字版由美国Pearson Education授权人民邮电出版社出版。未经出版者书面许可,不得以任何方式复制或抄袭本书任何部分。

版权所有,侵权必究。


通过本书对信息图表的介绍,你将学会如何利用图表这种工具挖掘数据背后的信息,并对这个复杂的世界产生新的见解。不管你正在面对的是何种数据——商业、科学、政治、体育,甚至你的个人理财——这本书都将向你展示如何应用统计图表、地图和解释型图表,以数据的形式描绘故事,并从中获知更多内容。


“欢迎来到Alberto的世界。Cairo的这本书内容精彩而且完整,包括理论、实践和具体案例。关于现实世界的信息图表,这本书讲述的内容清晰易懂;而且今后很长一段时间,我们应该不再需要另外一本类似的书籍。”

——Nigel Holmes

“如果图表设计师Nigel Holmes和数据可视化大师Edward Tufte有一个孩子,他的名字可能就是Alberto Cairo。在这本书中,技巧娴熟的图表新闻工作者Cairo将深思熟虑后的、成熟的、以科学为依据的理念用于信息图表设计,该理念正是这个凌乱的信息图表界所需要的。形式优雅、思路清晰。在这个设计理念中,他将信息图表的形式与实用完美地结合在一起,这些理念将影响几代人。”

——Stephen Few,《秀出数值》(Show me the numbers)的作者

“这本书意义重大。不论你是刚刚涉足信息可视化还是早已涉猎这个领域;不论你从事的领域是商业、科学、政治、运动,或者甚至是个人理财;不论你的期望是基本了解可视化还是对其应用的详细研究,这本书都可以满足你的需要。作为专业的新闻工作者、信息设计师和艺术家,Alberto Cairo用一种简单、直接、科学的方法展示了如何对事物进行可视化。”

——Karl Gude,《新闻周报》(Newsweek)的前任信息图表总监,密歇根州立大学新闻学院的图表编辑

“本书的内容生动有趣,是优秀的学习教材。我有许多关于可视化信息的书籍,除了Edward Tufte,Nigel Holmes和Richard Saul Wurman的著作,Cairo的这本书正是我要推荐给那些希望从事信息图表设计人士的5本书之一。很少有专家能够实现学术与现实经验的结合,但Cairo确实做到了。”

——Mario Tascón,西班牙咨询公司Prodigioso Volcán的总监

“利用丰富的专业知识和学术研究,Alberto Cairo给我们提供了可视化交流变革的第一手资料。对于认清印刷出版类信息设计和在线信息设计的现状,这本书非常重要。”

——Javier Zarracina,《波士顿环球报》(The Boston Globe)的图表总监

“对于准备从事信息图表与可视化研究的人士来说,本书是一个很好的切入点;对于那些在信息可视化领域已经有一定研究的人士来说,这本书也提供了一些很好的建议。可以说此书是关于信息图表的第一本真正的教材。”

——Chiqui Esteban,lainformacion.com的新媒体叙事总监,InfographicsNews的注册博客



亲爱的读者:

2013年11月,我收到了一份来自迈阿密大学传播学院一名硕士研究生的礼物,那时她刚毕业,是我带过的最优秀的学生之一。我讲授的信息图表与可视化课程,她获得了优,而且刚签约了一家主流新闻机构,担任多媒体设计师、信息图表编辑和程序员。她叫秦晨,正好来自中国(在这里顺便提一下,我的那些极具天赋而且勤奋的学生大多来自你们国家——有点儿跑题了)。

秦送给我的礼物是一本关于中国艺术家吴冠中的书。他的作品让人叹为观止,可以说是高雅、优美的可视化诗篇。吴对细节的关注、对色彩的掌控以及柔和的笔风直接触动了内心的那个偏向于设计与新闻工作的我。毕竟,吴的主要目的不同于我和我的同事所追求的:与读者有效交流。我们的区别不在于如何交流,而在于我们所谓的“艺术”是什么:对他来说,是情感与感觉;对我而言,则是数据和需要的信息。

我坚信,诸如吴冠中这样伟大的艺术家诞生于中国绝非偶然。我自己的学科——信息图表与数据可视化——似乎正在你们国家生根发芽也绝非偶然。你们在可视化交流方面有自己的传统,是源于历史的、根深蒂固的。我认为,一些新闻机构拾起这个传统也仅仅是个时间问题。多亏了最近的一篇文章,让我了解到新浪在信息图表方面下了很多功夫——为信息图表创建了一个专栏,还有《南方都市报》,诸如《新周刊》和《看天下》等杂志,以及诸如政见、网易之类的门户网站。

亲爱的读者,我希望你手中的这本书,能够帮助一些机构和你,提升设计能力和水平。

正如你即将看到的,本书不仅仅是一本图册,展示来自不同国家的示例,更多的是关于信息的图像化表达,它通过图表、地图、图解以及解释性插图等阐述了非常基础的知识和理论。这本书旨在说明,像其他工具一样,图像首先是一种帮助理解的工具,其受限于辅助读者完成预想的任务。当然,设计用于交流和传达信息的图像时,美化和有趣等属性也留有发挥的空间,但是我们的主要目的应该是追求准确、清晰和深度。我们对美的追求绝不能以牺牲事实为代价。

懂得这些核心原则需要一些时间和大量的解释,所以请耐心跟我一起感受这个发现之旅。我保证,认真体会这本书之后,你将会同我一样,对信息图表与可视化的力量充满热情。

Alberto Cairo

迈阿密大学传播学院

2013年12月


经历告诉我们,自我繁衍的人类原本就是一个谜,对未知充满了欲望。生命的曲折与否有时取决于机会和运气,而我们要做的就是事先做好准备,这样才能分辨并抓住机遇。我们的成长除了自身的努力,还受周围环境和人的影响。从这种意义上讲,我是世界上最幸运的人之一。在本书的开端,我会讲到,好奇心是任何交流者应该具备的最重要的特性。所以,我要感谢那些激发我的好奇心并帮助我专注于此的人。

这本书首先要献给我的父母。从小,父亲就引导我喜爱书籍和优秀故事,不论是科幻的还是纪实的,这使我对新知识的渴望永无止境。无意间,他也引导我利用图表总结和传达信息,以及在给别人讲述时如何做到准确、简要、清晰甚至有趣。除了是一名医师,父亲也是一名艺术家。他曾在西班牙一所地方大学讲授解剖学,他的一名学生告诉我,毕业多年后,大学时期唯一记得的一门课就是父亲讲授的。他说,原因就在于父亲讲课时在黑板上描绘的美丽图解和解剖图。

从母亲那里,我最珍视的教诲是:不论什么,只要你能够证明是对的,就永远不要放弃。

感谢我的编辑,Peachpit出版社的Nikki McDonald和Cathy Lane,从一开始准备这本书的时候他们就给予了很大的认可,并在著作过程中不断地给予支持和鼓励。

感谢我的西班牙编辑和发行人Luis G. Prado,《国家报》(El País)的Óscar Fernández,加泰罗尼亚-奥贝尔塔大学的两名同事Ferrán Giménez和Laia Blasco:多年前,他们建议我将对信息图表与可视化的所知写成书籍。在本书的创作过程中,他们给予了很多帮助。

感谢我的几名学生。首先要感谢Patricia Borns,她几乎阅读了整本书,并且在风格设计方面给予了很好的建议。这本书之所以具有很强的可读性,得归功于她。还有Eileen Mignoni和Sophia Dengo,几年前,他们阅读并编辑了部分章节的初稿。也要感谢Lex Alexander、Mel Umbarger、Lauren Flowers以及其他来自于美国北卡罗来纳大学(下文简称北卡大学)教堂山分校和迈阿密大学的学生,他们都给予了宝贵的意见和建议。

感谢Nigel Holmes、Stephen Few和Karl Gude对本书内容的认可,他们的点评对我来说意义重大。学习如何可视化展示信息时,他们的著作是我的主要资料之一。他们是这方面的大师,我在他们那里受益匪浅。也要感谢西班牙的信息图表大师Chiqui Esteban和Javier Zarracina。

本书中的许多例子来自我在巴西圣保罗《依波卡》(Época)杂志担任信息图表和多媒体总监时的案例。感谢与我共事的优秀同事们,首先是信息图表部门的Marco Vergotti、David Michelsohn、Rodrigo Cunha、Rodrigo Fortes、Gerson Mora、Luiz Salomão、Gerardo Rodríguez、Erik Scaranello和Pedro Schimidt。还有艺术总监Marcos Marques,他为新闻杂志制作的封面是我见过的最优秀的作品之一。感谢Helio Gurovitz和他的助理David Cohen,这两位经理人都具有计算机科学与工程的知识背景,懂得可视化和数据新闻学。

感谢迈阿密大学和北卡大学教堂山分校的同事:Rich Beckman、Laura Ruel、Don Wittekind、Pat Davison、Charles Floyd、Kim Grinfeder、Michelle Seelig和Jim Virga。也要感谢那些院长和系主任,我从2005年开始讲授图表与可视化方面的课程,这期间他们给予了很多支持和鼓励,他们是Richard Cole、Tom Bowers、Jean Folkerts和Gregory Shepherd。

感谢每年组织和参与Malofiej国际信息图表峰会(www.malofiej20.com)的朋友:Javier Errea、Álvaro Gil、John Grimwade、Geoff McGhee和Juan Velasco等。

感谢www.elmundo.es的创始人Mario Tascón和Gumersindo Lafuente,2000—2005年,我在那里担任图表总监,他俩给予新手的信任不亚于给予具有10年经验的老手。

感谢《加利西亚之声》(La Voz de Galicia)、《公报16》(Diario 16)、西班牙《世界报》(El Mundo)和DPI Comunicación的所有同事,以及我曾经工作过的其他报社和杂志的同事,不论是作为全职或者顾问。感谢所有授权我在本书中使用他们的信息图表的组织、公司和朋友。

最后,本书要献给我的妻子和孩子。在本书的创作过程中,他们给予了极大的鼓励和支持,并无怨无悔地付出。写作是我所知中最孤独寂寞的事情,没有他们的支持就没有本书的面世。我爱你们!


Alberto Cairo是美国迈阿密大学传播学院的老师,负责教授信息图表与可视化方面的课程,也是北卡大学教堂山分校技术与传播项目的硕士生导师。

2000年,Cairo在《世界报》成立了交互式信息图表部门,《世界报》是西班牙第二大印刷发行日报和第一大数字日报。2001—2005年,Cairo团队获得的Malofiej奖和新闻设计协会(SND)国际信息图表奖多于全球任何其他的新闻组织。

2005—2009年,Cairo担任北卡大学教堂山分校的教授,并多次在最具影响力的有关可视化新闻设计的国际会议上担任演讲嘉宾和主要发言者。他是许多国家知名高校的客座教授,包括美国、墨西哥、萨尔瓦多、哥斯达黎加、委内瑞拉、厄瓜多尔、秘鲁、巴西、智利、阿根廷、西班牙、葡萄牙、法国、瑞士、乌克兰、新加坡和韩国,并在这些国家受邀作为许多顶尖级新闻出版物的顾问。2006年,他开始担任加泰罗尼亚-奥贝尔塔大学的讲师,该大学是西班牙第一个提供在线认可学历的公立大学。


罗辉,教育部远程教育专家组成员、教育部金教工程总体技术专家组成员,四川农业大学教育技术系副教授,成都依能科技有限公司创始人。在知识可视化领域,著有《打开智慧的魔盒——思维导图、概念图应用宝典》。近年来,罗辉致力于将可视化技术作为公益事业在全国免费推广培训,受到了普遍的欢迎。


除了与思维心理学描述的不一样,感官认知环境的这种超凡机制无所不能。

——Rudolf Arnheim,《视觉思维》(Visual Thinking

如果让我选择一个这些年感兴趣的话题,那就是我们大脑创建并理解不同程度抽取的可视化表达的能力,这些表达是对数据、概念、关系以及地理位置编码后的图表。我们大脑是由一大块褶皱的肉与脂肪团紧缩在一起形成的腔体,而且就其本身而言,其展开的尺寸远远大于该腔体,这样的大脑是如何完成如此具有挑战性的任务呢?本书中,就自己的观点阐述了这个问题。

人类大脑包含许多与视觉感知相关的区域:致密互联的神经元群组负责处理和筛选眼睛收集的信息。进化让我们花费更多的精力在视觉感知和认知方面,对待任何事情都是这样,并影响我们的表达方式。向朋友解释一个难懂的概念时,当她明白了你的意思,她的眼睛会带着愉悦并充满活力地告诉你“我懂了!”

她眼睛所传达的完全有意义,因为在我们的大脑深处,看见与懂得是相互交织的过程。懂得是因为我们看见了,这种因果关系在其他地方也成立。正如稍后将要解释的,看见是因为我们事先对某些事物有了一定的了解,看见帮助理解,这种理解又为之后更好更深入地看见奠定基础。

我们人类是具有视觉感知的物种。引用Terrence W. Deacon的著名定义[1],我们也是一种符号性的物种。在大脑深处,我们的器官感知到的任何事物都转换成简单、可控的表达或者符号。这些符号通过人类使用的语言来表达,有的是口述,有的是文本形式。也可以用哈佛大学心理学家Steven Pinker提出的精神语言[2]来表达,即是大脑与自己交流的一种内部语言。

并非所有符号都可以口述。大脑不仅仅处理眼睛获得的信息,也产生心理视觉图像,通过这些图像我们进行推断并采取正确的行动。想象一辆公交车,在脑海中形成一幅图像。现在,我们测试一下:它是什么颜色,黄色、蓝色还是红色?有没有车牌号?你是否在车里面?这就是心理图像。懂得大脑处理这些事情的机制,有助于我们更好地交流和观察等。

这是本书的第1个主题。

第2个主题,信息图表与信息可视化的普遍特点。一些专家和学者对这两个学科提出了明确的界限。他们认为,信息图表通过统计图表、地图和图解表达信息,而信息可视化提供可视化工具,读者利用这些工具挖掘和分析数据集。也就是说,信息图表讲述故事,而信息可视化帮助读者自己发现故事。

接下来,我介绍一种与之不同的方法:信息图表与可视化的统一共存

想象两条黑色平行线。上面的这条,在其左边标注“信息图表”,右边标注“可视化”。下面的那条,在其左边标注“表达”,右边标注“挖掘”。所有图表都代表数据并允许一定程度的挖掘。一些图表几乎全是表达,所以对其只能进行有限的挖掘,我们认为它们偏向于信息图表(图1),而其他的则更多于让读者自己分析展示的内容,在我们的直线上它们偏向于可视化(图2)。所有信息图表和可视化都有表达和挖掘的成分:表达信息,同时也利于读者从不同角度分析内容。

图1 一个虚构国家的失业率

图2 Stefanie Posavec式著作有机体:《在路上》第1部分的可视化
来源:Jack Kerouac (www.itsbeenreal.co.uk)

举个很好的例子:Stefanie Posavec 的作品“文学有机体”(Literary Organism)。其美感在于组织形式、字体和颜色的谨慎选择,而且你可以采用多种阅读方式。树形图的每个分支都代表这本书讲解的一个更深入、更细致的单元,即书的章节、段落、句子和词语。颜色与代表的主题相匹配,如旅游、音乐、聚会、性等。

花费一定时间分析后,读者能够找出其模式并发现不同的信息。Kerouac的毕生之作还未创作时,关于书讨论的主题他首先构思了一张图表,专家和文学评论者才能利用这个艺术品检验假设和猜测。例如,性是《在路上》(On the Road)的一个普遍主题吗?那些衔接有关性和工作与生存的章节又如何?

图3是我制作的一张图表,阐述了表达与挖掘的互补关系。彩色曲线上的每个点代表巴西1981年—2010年中的一年。横轴代表GDP,单位10亿美元;纵轴代表不均等性水平,用GINI系数表示。距离右边越近,GDP(根据通货膨胀和平均购买力调整)越大;垂直方向越高,那年的不均等性越严重。

图3 巴西社会不均等性与经济增长的共变

也就是说,这张图表代表经济发展与社会公正的共变。大标题概括其主旨:GDP增长的同时,不均等性不一定下降。经济增长并不一定提高人民的生活水平,在巴西的这段历史上,这是一件不那么值得炫耀的事情。某些年,尤其是这段历史的前半期,经济增长的同时不均等性反而更严重。

完成这个项目的设计后,我把这张图表出示给一些中年同事,他们是2010年—2011年我在周报杂志《依波卡》工作时的同事。他们反应一致而且鼓舞人心。虽然他们不是设计师也不是艺术师,而是作家,但是只稍微用心就看懂了这张图表。

该图表向他们展示了这样一些事实,那就是所有大于40岁的巴西人都知道的:Lula执政期间(2003年—2011年),采取几项收入分配政策后,经济取得了持续稳定的增长;José Sarney和Fernando Collor执政期间,经济增长缓慢,不均等性无规律地上下波动;Fernndo Henrique Cardoso(FHC)上台后,采取一系列维稳措施,使巴西走出了通货膨胀的黑洞……

一些同事告诉我,这条彩色曲线如同历史标记,因为它揭示了两种变量间的关系,这是之前从来没有的。1981年—1992年年间(混乱期),曲线变化无章;1993年—2002年年间(稳定期),曲线变得平滑;2003年后,几乎是一条直线,显示该时期巴西的经济增长与均等性间几近完美的良好关系。自称非视觉的人士如何看待这种非常规的图表形式,又怎样从中得到满意的信息,而这些对我来说则异常清晰。

读懂这张图表而不是仅仅看一眼,从事“文本”工作的同事们的惊奇反应有其根源。这就是本书的第3个主题:图表、图解和地图不仅仅是用于欣赏的工具,更是用于解读和详细分析的工具。信息图表的首要目的不是满足眼睛的感观,而是可读性,然后才是美观;或者说美感源于优雅的实用性。

如果你是新闻工作者、设计师或艺术家,并且认为信息图表与可视化是对大量数据以一种引人入胜、全新的形式呈现,请继续阅读。希望我能够让你忘记那些过分简单的想法。Ben Shneiderman曾经写道:可视化的目的是得出见解,而不是图片[3]。图像是语言的词库,是手段和方法,而不是目的。你从来不会听到一名新闻写作者这样说,她/他的目的是通过优美的句子和精美的结构形成优雅的文学风格。她/他的写作风格是加强理解和唤起读者共鸣的一种手段,使读者能够轻易地从中获知不同的观点和想法。美感确实有用,但是没有好的内容作为坚实支撑的美感仅仅是哗众取宠。

本书中,我花费了大量章节描述可视化新闻学。因为我原本就是一名新闻工作者,而且我相信,许多新闻媒体在应用图表时面对的挑战与其他专业领域相通,比如销售、广告、商业情报和数据分析等。

对于报纸和杂志,信息图表通常由艺术部门制作。据我所知,信息图表总监从属于艺术总监,而且艺术总监通常是图表设计师。这样并没有错,但是容易引起破坏性的误解。本书的部分内容完成于巴西,在那里,新闻工作者和设计师将图表称为“艺术”。他们会用一种带着南美葡萄牙语的迷人腔调说:“Vamos fazer uma arte!”(“让我们来制作一件艺术品吧!”)试想,如果仅仅把图表当作一种艺术,那么许多修饰成分将掩盖实质内容,这样的话,信息图表就只是插图而已。

至少,长期保留的传统是这个错误产生的部分原因,导致可视化交流未能像写作那样提升到智力层面。对于许多传统新闻工作者来说,信息图表仅仅用来修饰稿件使之看起来不那么繁重,而且能够吸引读者,使读者有耐心去阅读那种长篇大论。所以,信息图表并没有当作用来扩展我们的感知和认知的工具,而仅仅是一种装饰。为什么会是这样一种情形?正如Rudolf Arnheim[4]所写的,这种传统追溯到远古的西方哲学,古希腊哲学家Parmenides和Plato等带来的根深蒂固的影响。不幸的是,虽然Arnheim主导的《视觉思维》已经出版了40年,但如今,那种根深蒂固的哲学思想仍然占据相当的地位。

所以,本书的第4个主题:可视化与艺术的关系,这类似于报刊杂志与文学著作的关系。新闻工作者可以借鉴文学方面的工具和技巧,受到优秀小说写作风格的启发,但是不可能将其作品变成文学著作。这种见解同样适用于可视化,所以,可视化本身就是一种实用艺术。

让我们开始信息图表与可视化的学习吧!

弗罗里达,迈阿密

2012年6月

[1] Terence W.Deacon, The Symbolic Species: The Co-Evolution of Language and the Brain (New York: W.W.Norton & Company, 1998).

[2] Steven Pinker, The Language Instinct: How the Mind Create Language (New York: Harper Collins Publishers, Inc., 1994). Pinker的精神语言建立于Noam Chomsky提出的一种与生俱来的通用语法假说之上。

[3] Stuart Card, Jock Mackinlay and Ben Shneiderman, Readings in Information Visualization: Using Vision to Think (London: Academic Press, 1999).

[4] Rudolf Arnheim, Visual Thinking (Berkeley: University of California Press, 1969).



掌握的专业知识越多,需要学习的也越多,我承认自己懂得的还远远不够……当你坦诚自己还不懂时,才更迫切地想问为什么,才能更好地学习。

——Richard Sual Wuraman,《渴望知识2》(Information Anxiety 2

最近有人问我,拥有怎样的特性才能更好地投身于可视化与信息图表这种事业。我的回答是:“永不满足的、孩子般的好奇心。”

好奇,趋于对任何事情都希望找出原因。正是好奇,使我从事新闻工作,而后专注于信息图表。如果你没有那种几乎对所有事情都感兴趣的高昂热情,比如,对那些怪异多变、不相关的主题,你也极其想弄明白为什么,那么,就不太可能成为一名优秀的交流者。可视化交流者的生活应该是自成体系的,是杂乱无章的有理化。就我而言,则有序地转换于新闻业、认知心理学、国际政策和历史。而你,则可能是运动、音乐、建筑或者其他的任何事情。

接下来,我举个例子说明良性好奇心可以带来多大的好处。

原本我打算在这章的开头讲述几个有关信息可视化、信息设计和信息图表的正式定义,但没有这样做,一些事情改变了我的想法。一次,我随意浏览《纽约时报》(The New York Times)网站时,一篇关于《理性乐观派:一部人类经济进步史》(The Rational Optimist: How Prospersity Evolves)(2010年)的评论引起了我的注意,该书的作者是英国科学评论家Matt Ridley。

这篇评论[1]非常苛刻,但是Ridley提出的假设听起来很有趣。这本书配得上这个名字,它让我们对未来的生活无限憧憬。我曾经读过Ridley的其他书籍,非常喜欢他的《基因组:23章讲述物种的自传》(Genome: The Autobiography of a Species in 23 Chapters)(2006年),所以,我比较偏向于Ridley。

我的好奇心由此被引发了,非常激动,于是购买了一本。下载这本书虽然只花了1分钟,但是那天我剩余的时间全部用于阅读该书(这里需要对本书的编辑说:“我保证,这么做完全是为了让这章更完美!”)。这本书写得非常好,让我欲罢不能,想一次读完。

书中关于出生率,即各个国家的妇女平均生育孩子数的那章引起了我的关注。你应该听说过灾难预言家Malthusiam,他说过,贫穷地区的高出生率导致地球需要供养70亿的人口,并预测20年后会达到90亿,而且将来会更多。

另一名灾难预言家则关注于发达国家的人口年龄,这些国家的出生率小于2.1,该值也称为“替代率”。如果一个国家的人口替代率显著低于2.1,那么这个国家的人口将面临“缩水”。相反,如果替代率大大高于2.1,青年人的数量就会增多,这也会引起一些问题。例如,因青年人数量增加而可能引发的更多暴力和犯罪。

Ridley通过对两种有趣趋势的讨论来反驳上述两种预测。平均来看,富裕国家的出生率很低,但是最近几年,有微小的上升趋势;另一方面,贫穷国家的平均出生率正在下降。这两种趋势恰好与传统观念相反,

经济即将处于领先地位的许多国家,如巴西,出生率下降显著:从1950年每位妇女生育的孩子数超过6个下降到2010年的少于2个。

基于这两种互补趋势,Ridley认为,几十年后全球各地的出生率都将趋于2.1,全球的人口数量将稳定在90亿。这个结果与直觉不符,不是吗?

Ridley的分析不无道理,其支撑数据来自联合国(UN)和世界银行[2]等,真实可靠。但是,我在阅读书中提供的证据时,总感觉不舒服。为此,我花费了一些时间来看清楚其中的缘由。Ridley提供了曲线和趋势,但是关于出生率和人口的那章只有一张图表,类似于图1.1。

图1.1 全球人口年增长率趋势

这张图简单明了,但是却不足以支撑Ridley的见解。该图表明,从时间上看,人口增长的趋势是呈下降趋势的。越接近现在,人口增长率越低。这张图表汇聚了全球各国的数据,但是却有碍于我们看清Ridley讨论的多种模式。

富裕国家出生率有所上升的数据在哪里?又从哪里能够看出诸如巴西、中国和印度等发展中国家的人口正趋于稳定?

之前说过,我总是充满好奇心。所以,除了用一天的时间阅读这本《理性乐观派》(The Rational Optimist),我也搜寻了书中关于人口那章使用的数据。通过这些数据,能证明作者的假设吗?

我做的第一件事是访问联合国网站。搜索“联合国数据”,你将很快找到这个网站(http://data.un.org/),如果想查找关于人口、教育、经济和社会发展等大型数据,这里就是你要找的“天堂”。在联合国网站,我搜索了出生率数据,这些数据始于1950年,预测数据远至2100年。

忽略2010年以后的数据,我只对在此之前的真实数据(那时)进行分析。通过网站的筛选功能,我选择了联合国做过全面研究的150多个国家的数据,图1.2所示为我获得的数据表的截图。

图1.2 联合国数据表

我下载了这张数据表,准备用这些数据做一次低技术可视化练习并展示给我的学生——绝大多数为新闻工作者,而且没有技术背景——向他们说明,学习创建信息图表并不总是很难。

运用办公软件套件(包含数据表功能的一种开源软件套件),删除部分单元并对这些数据进行重组。因为要删除部分单元,所以需要一些手动调整——调整量并不大。图1.3所示为调整后的图表。

图1.3 调整后的联合国数据表

还跟着我的思路吗?现在,有趣的事情发生了。在计算机里,我们拥有了这份数据表,但是它有意义吗?几乎没有,我们很难从数据表中获取有用的信息。阅读这些数据,你能发现有趣的规律吗?如果回答是肯定的,那么恭喜你,你拥有超强的记忆力。绝大部分普通人不善于处理海量数据。不信的话,我们可以做个测试:回到图1.3,请告诉我,1950年—1975年,西班牙和瑞典的出生率在哪个时间段的差距变大,哪个时间段的变小?

这件看似简单的事情做起来却不那么容易:看一个数据记住它,再看下一个,记住并与前一个比较,如此循环直到最后一个数据。这是一件很麻烦的事情,我不会这样做。

但是,如果我们把这些数据做成简单的图表呢?这个结果(图1.4)就是能够帮助我们轻松回答上述问题的可视化工具。图中展示的信息非常清楚:从1950年开始,西班牙的出生率高于瑞典,1970年后,西班牙的出生率显著降低,在时间轴上的最后5年里有略微上升;另一方面,最近60年,瑞典的出生率虽然低于替代率2.1,但一直很稳定。

图1.4 西班牙与瑞典的出生率比较

给数据一种合适的形貌,编码后以图表的形式展现,与未这样处理的数据表相比,分析这种图表将节省更多的时间和精力。

任何图表与可视化的首要和最终目的是作为协助我们的眼睛和大脑发掘现象背后隐藏信息[3]的一种工具。

显然,与展示100个国家的数据相比,再现两个国家的数据非常容易,这就是我们在判断Matt Ridley的一些观点时可能需要做的。如果把所有国家的数据信息都展示在图中,结果则与图1.5类似。这些意大利面条般的彩色线条看起来可能有趣,但是于我们的目的无用。这张图仅仅用一个软件就可以实现。

图1.5 过多的线条使信息变得杂乱

记住,我们想要寻找的是这些线条出现(代表富裕国家出生率有所上升的线条和代表贫穷国家出生率有所降低的线条)在2.1左右的预计交汇处。如果研究图1.5的时间足够长,可能会发现一些规律,但是你更多会选择放弃。

要解决这个问题,可以给这些混乱的线条加入可视化层级关系。显然,不能让所有线条的可视化程度一样,否则没有任何意义。在信息图表中,展示的与被隐藏的同样重要。我通过Adobe Illustrator打开这张利用办公软件生成的图表,对代表少数富裕国家和发展中国家的线条进行彩色高亮显示。

对于代表其他国家的线条,我采用灰度显示,这些数据仍然保留可见但是并不会模糊信息。为什么不丢掉这些灰度信息?因为它们为重点显示的信息提供依托。

如果所有的背景线条都采用一种颜色,就不可能分别以个体看待它们。这些线条整体呈现下降的趋势——你会发现,始端1950年,许多国家的出生率为6.0~8.0,2010年时,只有少数国家的出生率仍然保持在这个数值范围。与图1.5相比,图1.6看起来更加清晰明了。

图1.6 全球人口出生率

带着对这些发现的兴奋,我分析了《理性的乐观者》的其他论断。Ridley认为,一个国家出生率的突然降低受几个因素影响:人均收入的增加、女性受教育程度的提高和婴幼儿死亡率的降低。事实上,婴幼儿死亡率的降低和女性受教育程度的提高都与越来越好的家庭规划有关。

从经济方面讲,Ridley认为,在富裕国家,空闲时可做的选择很多,而且需要投入的财力和精力相对较少。现代社会让我们关注更多,从毫无控制的传宗接代任务中获得解放,尽管只是部分的。我们可以用一种非科学的说法来解释这种现象:一对夫妇生育孩子的平均数与他们关注其他任何事情花费的平均时间成反比。这可不是开玩笑的。

为了弄清楚出生率、收入及女性受教育程度间的关系,我在同一数据表中作了两张离散点图。如图1.7所示,图中每个点代表一个国家,横轴代表出生率,纵轴代表人均收入(第1张小图)和中学女生的比例(第2张小图)。

图1.7 人均收入、女生比例与出生率的关系

图中的黑色曲线为趋势线或回归线:离散点距离这条曲线越近,纵横轴两个变量间的关系越紧密。你会发现,有些点与这条曲线非常吻合,所以,纵横轴两个变量是紧密相关的。总地来说,在某个国家,家庭越富裕,孩子越少;中学女生的比例越小,孩子越多。

从这个实践中我得到的经验是:完成这个项目仅仅花了3~4个小时,通过该项目我找到了那些支撑Matt Ridley关于出生率演变规律的证据。当然,他的假设也存在一些偏差。但是,如果没有把数据展示给读者,让读者看见它们、阅读它们并进行挖掘和分析,他们又怎会相信你?这是许多新闻工作者,尤其是那些评论者更应该经常思考的问题。

刚才的例子并非我随意选择的。它有助于深入一些主题,这些主题对于我们理解图表作为一种交流形式的现状必不可少。我们能够读懂图表,并且利用它们发现肉眼不能看见的其他事实,这难道不神奇吗?二三十年前,心理学揭示了许多涉及这种理解方式的大脑机制。另一个思考:是否注意到,我使用的数据都是可以从互联网上免费得到的?所以,我用来证明Matt Ridley论断的方法适用于每个人,而且只需几个小时就可以学会,这不是很棒吗?

这3种趋势的汇集把可视化推向主流。10年前,数据量小、软件贵而且难用的时候,图表设计并不大众化。目前,指导设计的法则还未清晰明朗,所以,我们具有这种潜能,可以利用更加科学的方法发挥图表的作用。

研究图表与可视化还需要更多的投入。引用国际数据公司(IDC)的研究,《经济学家》(The Economist)报道,仅2010年的信息量就达到了1 200EB[4],相当于著名英国杂志上成千上万个数10亿的议题。也就是说,现在存储的所有数字信息已经达到了几个ZB。我们面临的挑战到底有多大,以下说明可以帮助你理解。

1bit,二进制位,计算机存储信息的基本单位,代表0或1

1B=8bit(1B:编码一个字母或数字需要的信息量)

1KB=1 000B

1MB=1 000KB=1 000 000B(106)

1GB=1 000MB=1 000 000 000B(109)

1TB=1 000GB=1 000 000 000 000B(1012)

1PB=1 000TB=1 000 000 000 000 000B(1015)

1EB=1 000PB=1 000 000 000 000 000 000B(1018)

1ZB=1 000EB=1 000 000 000 000 000 000 000B(1021)

1YB=1 000ZB=1 000 000 000 000 000 000 000 000B(1024)

是不是很困惑?不用着急,你不只是一个人,还有我们。1YB的信息量是巨大的,根本就难以想象。2010年8月,Google的前任CEO Erich Schmidt在一次会议上宣布,有史以来到2003年,粗略估计的数据量已经达到了5EB,而今,我们每两天就会产生这么大的数据量。

Schmidt说过:“信息膨胀的速度比任何人想象的都要快得多。”5EB比以DVD存储的200 000年的视频信息数据量还要多[5]

确切地说,并非所有“信息”都是人们交谈中所谓的信息。信息绝大部分来自计算机、手机和其他设备间的通信,以及设备本身处理需要而自动产生的,这些信息对人类而言没有任何意义,但也是信息。

该议题到此为止,我们接着看后面的内容。

20世纪70年代,互联网还未全球化的前几年,北卡罗莱纳州的建筑学专家Richard Saul Wurman曾经预测,随着信息膨胀,必将产生一种新的专业领域来实现数据重组并让这些数据变得有意义。Wurman认为,我们人类面临的最大挑战是,如何应对即将来临的数据风暴。

Wurman将这些人称为信息架构师,其他人对信息架构学定义如下。

Wurman认为,信息架构学的主要目的是帮助用户远离信息焦虑,即“数据与知识间的黑洞”。

对于如何掌握那些以纳秒级速率更新的知识,人们仍然感到焦虑……

我们已经懂得的和我们认为应该懂得的之间的缺口越来越大,信息焦虑由此而生[6]

图1.8展示了这种缺口。基于DIKW(Data、Information、Knowledge、Wisdom)模式,图中分解了Wurman法则中的两个极端因子。虽然该模式被认为过于简单和模糊[7],但是有助于解释可视化与图表。

图1.8 信息从现实到人类大脑的过程

图中,未构建信息代表现实,即外部世界极其错综复杂的事物。能够感知或者检测到的任何现象都可以称为信息。

数据是对观测现象的记录,可以编码成描述并代表现实的符号(数字和文字等)。未构建信息和数据之间存在第一次编码。假如,一名研究员正在研究出生率,数据就是电子数据表中的记录,如2、5、6、2、2、2、1、1、4、3、3(这些数字代表每位妇女生育的孩子数)等。

第二次编码将我们从数据带至构建后的信息。当一名交流者(研究员、新闻工作者或其他人士)用文本、图形或其他方式表达数据时,该过程发生。也可以说,这名交流者将数据成形,使相关模式呈现。

通过对这些模式或数据的感知和理解,读者的知识可以得到提升。这不是一个被动的过程,我们的大脑并非像硬盘那样随意存储信息。当人们看到、读到或听到的时候,会把这些内容与曾经的记忆和经验关联起来。

当我们对得到的知识进行更深层次的理解时,当我们结合之前的经验和新的信息并类推运用于其他情形而不只是“得到”时,甚至是仅仅与我们的原始知识相关时,我们便到达了智慧这一层次。正如并非所有得到的信息都可以变成知识一样,不是所有的知识都可以转变为智慧。

图表中的每一步都是逐级上升的次序。面对这个世界时,我们无意识地强行组织那些眼睛看见并传递给大脑的未构建信息。我们运用层级关系,而不是一次感知所有的眼前事物,这在后续内容中将进一步说明。举例说明,运动的事物之所以比静止的更吸引我们的注意力,是因为运动的事物可能预示更大的威胁。因此,相对于其他,我们更关心运动的事物及其位置。我们的大脑首先关注运动的事物,至于为什么也许连我们自己都不知道。

著名的技术哲学家Kevin Kelly在其著作《科技需要什么》(What Thechnology Wants)(2010年)中说过:“思想就是对现实信息的高度提炼。当我们说理解了,就是那个意思,它的产生是有次序的。”

所以,大脑总是无意地拉近现象与那些有助于我们生存的知识或智慧间的关系。这就是所谓的认知能力。信息架构师的作用就是,在人们自己处理信息前参与这个过程并给他们提供一种步骤和方法。

现今,信息架构师有泛指的和专业的,他们采用的工具和理论大相径庭。除了学术界,信息架构师可以是编写技术手册的人员,也可以是软件工程师、网页设计师、导航设计师(当然,这是一名专业人员,试想,谁能轻易地创建那些难以驾驭的公共空间?),还有那些仅仅因为有趣而制作出生率图表的人士都可以是信息架构师。

所有这些专家的共同目的都是为了帮助读者更容易地认识这个世界,如此宏伟的目标用一个框架来实现是不大可能的。本书的目的就是,把信息图表与可视化作为信息架构的一种形式。但是,怎样才能更加准确地描述分支与主干间的关系呢?

如图1.9所示,把信息架构学看做一个大圆圈,圈内是用于处理信息的定律集合。最相关的定律之一是斯坦福大学Robert E.Horn提出的信息设计,定义为“人们能够有效地用于信息处理的艺术与科学[8]”。信息设计者的目的是准备文档(包括模拟的和数字的)和空间以便于轻松驾驭。

图1.9 信息架构学、信息设计和信息图表的关系

信息设计的一个重要部分是信息图表与可视化。学术著作有时将信息图表从可视化中分离出来,并将后者定义为“支持计算机、交互式的数据可视化表达并放大感知的一种应用[9]”。我倾向于著名西班牙设计专家Joan Costa更直接的说法,可视化就是“让一些现象或现实可见并且易懂;这些现象大多是肉眼观察不到的,有些甚至不具备可见性[10]。”

为何Costa加入可见性非必要?因为图表既可以采用模拟的形式展示,也可以采用非模拟的形式。何为模拟?想象一张按比例绘制的地理图,或指导你如何使用新洗衣机的手册,或一张关于飞机坠毁的信息图表,如图1.11所示。这张大图来自Público,一个中等规模的西班牙新闻社,其编辑部虽小却不乏天才。

另外一些展示抽象现象的图表属于非模拟类。在这些图表中,描述和被描述之间不存在模拟,二者之间的关系是约定俗成的,而非本然(如图1.10所示)。失业率根本不是方形的彩色格子,不是吗?

图1.10 美国失业率的Web图表
来源:《华尔街日报》(The Wall Street Journal),2010 Dow Jones& Company, Inc

图1.11 马德里巴拉哈斯机场飞机坠毁事故信息图表
来源:Chiqui Esteban、Mónica Serrano、Álvaro Valiño

首先,我要向大家介绍一个重要观念:可视化应该被看成是一种技术。这听起来可能有些奇怪。说起技术,通常我们会想到这样一些设备:MP3、汽车、冰箱、电动牙刷、割草机和计算机等。这些设备有何共性?我指的并不是它们本身,而是内在本质。

1.是我们自身的外延。半个世纪之前,加拿大传媒思想家 Marshall Mcluhan首次提出这个概念。不是徒手,而是在割草机的帮助下花园变得整洁;电动牙刷可以清洗那些连牙签都不能解决的齿间缝隙——顺便说一下,牙签也是一种技术产品;MP3不仅仅是一个播放器,它还帮助我们记住那些承载着美好或悲伤记忆的歌曲。

2.是实现目的的方法和手段。有时是一个目的——冰箱保持食物新鲜——也可以是几个目的。如计算机,其功能取决于安装的软件等其他技术。一种技术还可以嵌入另一种技术。

作为技术,可视化也具有这些特征。其实,技术一词本来就有多种意思,其解释是开放的。这里,我引用W. Brian Arthur的著作《技术的本质》(The Nature of Technology)(2009年)中的意思。从该书可知,我们可以从3个层次来理解技术一词,如图1.12所示。

图1.12 3种层次的技术:全体、群体和个体

Arthur的意思是,技术首先是辅助完成任务的任何事物、过程或方法,即“一种达到目的的方法和手段”。这就是技术个体,前面提到的冰箱等设备都属于技术个体。运行软件的算法,以及交流使用的字母、句子和段落都是技术个体,甚至一个微小的钉子也是技术个体。

技术群体是“实例与部件的集合”,也就是技术个体的组合,而且这些个体组合在一起能够形成新的东西。电子系、生物化学及各种工程学都是技术群体,W. Brian Arthur也将技术群体称为“技术组合体”。

技术的第3层含义是“一种文明拥有的设备与工程实践的全体组合”,即技术全体。

信息图表与可视化之间是怎样的关系?首先,作为新起的学科,其形成仍然借鉴了其他领域的概念、方法和工序,这些领域包括:地图设计原则(来自制图学),运用图表展示数据的指导方针(来自统计学),巧用字体、布局和色彩的规则(来自图表设计),以及写作风格原则(来自新闻学)等,此外,还包括大量软件工具。

第二,也是更重要的,独立的信息图表也是技术,是实现目的的方法,是帮助读者完成相关任务的设备。这是显而易见的,后文会具体说明。如果你认同可视化首先是一种工具,也就说明你同意它所归属的学科不仅仅是艺术,也是实用艺术,其表现的美感并非源自画家或雕刻家的任意主观发挥,而归因于工程师仔细的思考和受限的斟酌。

[1] William Easerly, “A High-Five for the Invisible Hand,” The New York Times, June 11, 2010.

[2] Matt Ridley, The Rational Optimist: How Prosperity Evolves (New York: Harper Collins).

[3] 当时,这个观点促使了一些优秀书籍的诞生,这些书籍的作者包括Edward Tufte、William Cleveland、Stephen Few和Stephen Kosslyn等,见本书最后的参考文献目录。

[4] “All too much: monstrous amounts of data.”The Economist, Feb. 25, 2010.

[5] Google Atmosphere 2010 conference.

[6] Wurman, P. 14.

[7] David Weinberg,“The Problem with the Data-Information-Knowledge-Wisdom Hierarchy,”Harvard Business Review, February 2010.

[8] Robert Jacobson, ed. Information Design, (Cambridge: MIT Press, 2000).

[9] Card, Stuart, Jock, Mackinlay, and Ben Shneiderman. 1999. Readings Information Visualization: Using Vision to Think. San Francisco: Morgan Kauffmann.

[10] Joan Costa, La esquemática: visualizar la información (Barcelona: Editorial Paidós, Colección Paidós Estética 26, 1998). 关于信息可视化表达,这是我读过的最好的书之一。遗憾的是,没有英文版本。


只有通过数据的内容、设计者希望读者回答的问题和听众的类别,才能评价一张图表的可用性。

——Stephen M.Kosslyn,《为眼睛和大脑进行的图表设计》(Graph Design for the Eye and Mind

信息图表帮助我们完成某些智力任务,这使其有别于精细艺术。艺术家将图作为表达内心世界的方式,信息图表或可视化则更专注于客观、准确、实用和美观。简而言之:功能限制形式。

以原始术语“功能决定形式”及其随着时间所经历的各种论断作为开端,本章将探讨这个观点及其对信息图表与可视化的作用。初始,大家观点一致,后续的不同声音促进了对形式与功能间关系的进一步理解。

首先,用一个真实的例子说明我的意思。作为全球经济排名第六的经济体(2011年英国经济与商业研究中心数据),巴西虽然是南美洲的大国,其军备力量却与之不匹配。与巴西相邻的一些国家,如委内瑞拉和智利,每年都投入相应的大量财力以维持其海陆空实力。正因为如此,问题出现了:巴西以近发达国家自居并以此为豪,而且想昭告全世界。所以,2008年8月,巴西政府宣布了一项新的战略防御计划,这曾经是多年前公众讨论的焦点。

《圣保罗报》(Folha de São Paulo)是巴西的主流报纸,它拥有这个国家最大的信息图表团队,而且人才济济。当时,《圣保罗报》将整整一页的篇幅用于评论Lula da Silva的新战略计划。那是一版时政评论,阐述了为什么那项防御计划的部分内容并不妥当,以及巴西邻近区域的一些竞争对手更多地关注于领土和领海防御的事实。

这篇评论使用了两张信息图表。第1张是2009年的巴西防御预算明细,第2张是图2.1的资料来源,名为“邻里防御:巴西周边国家的军备实力概况”。

我将利用图2.1演示一个练习。前面我提到并建议,在报纸、杂志、书籍或网站上看见信息图表时都可以作这种练习。这种练习有助于你成为一名信息图表与可视化专家。第1步很简单,询问自己如下问题。

图2.1 南美军备概况

设计者希望我利用这张图表做什么?

也就是说:如果我们认可信息图表首先是一种工具,那么这张图表将要帮助我们完成什么任务?针对这张巴西防御图,我列出如下清单。

1.这张图表必须展示一些参数——军队规模、人口数量、防御预算等——这样,我才能了解一些基本信息。

2.可以进行比较。只须一眼,我应该能够说出哪个国家的军备最强,哪个国家的军备最弱,其人口数量多还是少,或其军费投入多还是少。

3.有助于根据变量和比较条件将这些国家进行从大到小的组织排列。

4.能够将一些统计关系和关联明显地展现出来。例如,人口数量与防御力量是否成比例?

通过实现这4项任务——展示、比较、组织、关联——将得到一张优秀的信息图表。如果一张图表给出了大量参数和数值,但是没有适当关联,读者很难对这些数据进行挖掘。

试想,如果你是一名巴西人,第一意识可能是将自己的国家与委内瑞拉和阿根廷进行比较,这两个国家是该区域巴西的主要商业和战略竞争对手。如果想对某些数据进行比较,如人口数量,你必须读完所有数据并记住,然后在脑中组织这些数据。这实现起来有多难?想要比较军备预算时也一样。

这项任务需要超凡的记忆力。从实用的角度讲,图表与简单的表格稍有不同。图表看起来可能会美观一些,但是仍然很难从中提取一些基本信息。

另外,是否有必要将地图作为主要的可视化元素?我不这么认为。这样做会让人觉得该图表的主要目的是展示巴西周边国家的分布——而这些内容《圣保罗报》的绝大部分甚至所有读者均已知晓。

为了表示公正,我知道,《圣保罗报》图表设计者的时间确实紧张,从记者那里得到这些数据后,他只有2个小时制作这张图表。对大事件新闻进行反复斟酌的时间有限,效果也只能如报纸上所呈现的。尽管如此,如果事先经过10~15分钟的思考和计划,我相信这张图表会得到很大的改善。

接下来是我们这个练习的第2个步骤。

一旦我们确定了图表要帮助我们完成的目标,接下来就该考虑数据的展示形式。

从比较开始。先前出版的信息图表并没有给我们带来便利。数据都在这里,但是人口数量和预算没有可视化展示。在心中比较这些数据——如果读者想知道不同国家间的相关参数是否成比例就不得不做的事——是非常困难的。

图中军队规模用小人代表,每个小人表示1 000名士兵。之前的图表中,这些符号没有意义,因为它们没有放在同一水平线上,这让原本很容易实现的比较变得困难。如果按照图2.2那样排列士兵,则非常容易进行比较。

图2.2 南美军备概况

如果你认同采用柱状图表更容易比较,那么现在我们把这些国家的军队规模也采用柱状表示并从大到小排列。如图2.3所示,你可以得出:读者很容易找出这场南美军备赛(我做了略微地夸大)中的赢家和输家,而这在之前的《圣保罗报》的图表中需要花费很大的精力。

图2.3 南美军备概况的传统柱状图表

这时,出现一个新问题。从各种排名来看,似乎巴西都是赢家,因为一个国家的人口数量越多,其军备规模越大,防御预算也越多。但是这些关系是否成比例?也就是说,如果一个国家的人口数量是另一个国家的n倍,其军备是否也是n倍的关系?

这个问题与前面提到的第4项任务有关,即参数间的关联。前面的图表不能实现这个目的,因为它处理的仅仅是绝对数据。

试想,如果你打算将密歇根底特律的暴力犯罪情况与纽约波基普西的进行比较,又该怎么办?你肯定不会使用被害人总数之类的绝对数据,因为底特律比波基普西大得多,所以其犯罪总量必然也很大。

相反,你会导出一个新参数,即把每个城市的犯罪份子总数除以其人口数,再乘以100 000,得到的结果为每100 000个人中的犯罪人数。

同理,这也适用于巴西防御信息图表。如果我们将军队规模与人口数量关联,或计算出防御的人均投入,这时我们可以得到什么?排名将完全不同。相比于图2.3,图2.4给读者提供了更多而且更深入的理解:军队规模的绝对数据最大的并不代表其相对数据也最大。从相对数据而言,巴西人的爱国情结有待加强,因为每1 000人中的参军数这一项,其排名倒数第2,而委内瑞拉和玻利维亚这些国家在这一项都比巴西强,受游击战争影响的哥伦比亚则遥遥领先。

图2.4 以二次编码后的变量作为图表参数的南美军备

是否可以利用绝对数据表示相互关系?当然可以。你可以设计一张离散点图表,即第1章提到的那类图表。

经过对《圣保罗报》中展示的图表的思考,我重新设计了一张离散点图表,名为“从另外一个角度看数据”,并与前面的图表放在一起(图2.5)。如果这是一个真实的项目,我不会这样做,因为从本质上讲,它与之前两张柱状图表传递的信息相同,但是说明了很重要的一点:在多数情况下,对特定数据集进行正确编码的方法不只一种。也许你有多种选择,但首先需要思考的是,通过你的信息图表读者更喜欢回答哪些问题。

图2.5 防御信息图表的另一种表达

“功能决定形式”源于1896年,出自美国建筑师Louis Sullivan的文章“经过艺术设计的高层办公建筑”(The Tall Office Building Artistically Considered)。文中,Sullivan探讨了大型办公建筑使用者的需求。19世纪末,该需求开始猛增。文中经常被引用的部分如下。

一切事物原本就有一个形状、一种形式和外在表现,这些告诉我们它们是什么,并将其与我们自己和其他事情区分开来。树、鸟、鱼等存在的这种本然形状向我们展示其生活及本性,它们具有特性、可认知,就是我们所谓的“天然的”,它们原本应该如此……生命通过自己的表达方式被认知,功能永远决定形式,这是一切事物具有的普遍规律,不论是有机的还是无机的,唯物的还是形而上学的,人类的或超人类的,以及脑海中、心中或精神世界的存在。这就是这个法则[1]

加粗文字是为20世纪的建筑学定义的,并给同时期的大师带来了深远的影响,不管他们是完全接纳(鲍豪斯学派),还是反对或者有细微改动地借鉴(Frank Lloyd Wright)。一些享有声誉的伟大理念,如Le Corbusier将房子定义为“用于居住的机器”,都与Sullivan的理念直接相关。

现在,忽略本质——建筑、工具、软件程序——关注用户,我们把Sulivan理念当作集合所有设计的召集器。当然,这并非Sullivan撰写那篇文章时的想法。他所谓的“功能”不是为了设计一种帮助我们完成任务的工具,而是事物的固有属性,是一种本质,不论该事物是人造的还是天然的。由Sullivan的理念可知,这种形式代表事物的本性。

事实上,对Sullivan的误解可以归为有用的悖论,给历史增添了色彩。毫不夸张地说,在我们弄清楚可视化中形式与功能的关系前,对几种谬误进行讨论是有必要的。

思考以下文字。

一切事物原本就有一个形状……一种外在表现,那些告诉我们它们是什么……树、鸟、鱼等存在的这种本然形状向我们展示其生活及本性。

如果还记得高中生物课的一些内容,你将会明白为什么对这些东西首先感到的是有趣,最后才是荒谬。如果遵循Sullivan思维,就像近代思想家那样,我们可以推测,鱼和海豚属于同一动物科类,因为它们的身体形态非常相近。或者我们可以说河马是大象和犀牛的近亲,因为这三者都有长鼻子、大体形、硬皮肤和厚厚的脂肪等特征。但是,正如科学世界经常发生的那样,事实(如遗传学)与表象有时是相冲突的。河马其实是由那些从海里爬上陆地再回到水中的鲸鱼进化而来[2]。未经验证的直觉是不可信的。

即使在技术领域,物体的形状明确与功能相关的说法也是没有根据的。确实,勺子是凹形的、固体的,所以能够承载液体,由此可以得出我们能够利用它将食物送到嘴里。但是iPod呢?从中心轮盘的形状可以推出它的使用方法吗?几乎不可能。这种情况下,形式与功能间的关联有待进一步研究。这说明,我们不能完全照搬Sullivan定律。

Sullivan定律的另一个问题是,命题“功能决定形式”表明二者间的关系是单向的。刚开始,似乎是这么回事。毕竟,除了飞行,翅膀还能用来干什么?如果翅膀进化了,肯定是为了逃离追捕者或为了够着树顶上的果子。

问题是,这个世界并非那样运转。对于物种来说,并不是先有需求(功能)再产生相应的器官(形式)。如果曾经有类似这样的想法——部分人现在仍有这样的想法——你就陷入了Lamarck谬论。

Jean-Baptiste Lamarck生活在19—20世纪,是最先阐述进化论机制的科学家之一。在他那个时代,一些迹象表明存活物种与已经绝灭的祖先间是相关的,存活者是其先祖的后继,由始如此循环。Lamarck及其他科学家并没有发现其中隐含的逻辑关系,即只要有足够的时间,这种潜在的力量可以使一种动物或者蔬菜进化成另外一种完全不同的物种。

Lamarck提出了一个科学理论,叫做“获得性遗传”。为了便于理解,我们以长颈鹿为例,它们是远古物种的后代,其祖先类似现在的羚羊。长颈鹿的脖子是怎样进化而来的呢?

根据Lamarck思维,数百万年前,一些羚羊需要食取高处不能够到的树叶,它们开始伸长脖子。这样的结果是,它们的下一代拥有稍微长一些的脖子。这就好比说,如果从现在开始强化健身,变的跟Sylvester Stallone一样,那么我的孩子将会生来就拥有强健的肌肉。对于Lamarck学说的追随者来说,就像字面意思那样,功能决定形式,后者推动前者。

现在我们知道进化论不是那样的,这还要感谢Charles Darwin。他的著作《物种的起源》(On the Origin of Species)出版于1859年,替代Lamarck论提出了另一个假说。进化的动力不是后代对其祖先特性和技能的遗传继承,而是适应环境的优胜劣汰。Darwin说颠覆了Lamarck论:功能并不决定形式。事实上,在多数情况下,其反面也是成立的。

首先,我们要清楚什么是Darwin所谓的自然选择。仍然以长颈鹿为例,Darwin说可能是这样的[3]:多代之前,长颈鹿的祖先生活在草原和森林,以蔬菜为食,因为DNA(Darwin并不知道DNA,没有关系,但他确实知道孩子长得像父母)的微小变化,新生幼崽长大后的脖子有的比父辈长,有的则相对短一些。这叫做变异。

在一些特殊时期——可能是干旱引起的草地减小,或者长颈鹿的祖先家族迁徙到一个食物较少的草原——拥有较长脖子的就显示出其优势。它们可以食用那些远远高于地面的树叶。

相比于同类,拥有较长脖子的早期长颈鹿寿命更长而且更健康(平均情况)。它们的后代也会更多,并继承变异后的长脖子基因。如此循环,拥有较长脖子的有利变异让其后代在生存竞争中处于更加有利的地位。

换句话说,每天需要够着更高处的需求(功能)并不能使脖子变长(形式)。长脖子是基因突变的结果,这些突变的基因受环境筛选(即选择)。大自然中,形式与功能的关系比Sullivan认为的还要复杂得多。

另一个原因也反驳了形式与功能间的因果关系。回忆我们的问题,“除了飞行,翅膀还能用来干什么?”当然,翅膀原本的作用不是飞行。鸟类源自恐龙,这些恐龙经过进化逐渐产生的羽毛不是为了飞行,而是为了保暖和吸引异性。羽毛的作用——恐龙的竞争优势——是保暖和看起来更漂亮。

但是进化后最终产生了另外一个可能的作用:控制羽毛末端周围的空气流动,由此而有了原始的滑翔形式。这就是古生物学家Stephen Jay Gould所谓的功能变异,即为适应环境而进化后的特性用来实现另外一个完全不同的目的(飞行)[4]

技术领域的功能变异也很常见。互联网就可以看做是一种功能变异。其原本设计的目的是为了加强科学家之间的沟通交流,最后演变成公众的一个虚拟世界,帮助各行各业人员实现资源共享。Guttenberg发明的印刷机,其设计借鉴了先前用于压榨葡萄和酿酒的技术。印刷机最初是用来压榨葡萄的,其设计形式也与该功能吻合。机缘巧合,一些人发现这种设备可以实现另外一个完全不同的功能[5]

诸如此类的例子帮助我们理解这样一个事实,形式与功能间的关系是双向的。功能并不总是决定形式;许多情况下,形式决定功能,而这个形式源自另外一个不相关的功能。

这很容易理解。试想,远古时期,一名祖先漫步于森林中并发现了一块很尖的三角形石头。他拾起这块石头并觉得拿在手中刚好。这种形式有何功用?什么也没有,直到他发现可以利用这块尖状石头达到某种目的,如切割皮毛、肉或骨头等。经过智者的眼睛和思考,自然的事物也可以变成一种技术。

Louis Sullivan的粗略本质论引起的误导并不反驳这样一种观点,那就是形式与功能是而且必须是密切相关的。是的,正如我们刚才所讲到的,功能不一定决定形式。但是这个观点也没错,那就是技术实体的形式必须依赖于其辅助完成的任务。处理信息图表与可视化时需要记住的重要原则之一是:形式应该受制于你所展示的功能。为了便于读者操纵并从中提取有用的信息,数据集的展示可以采用多种形式,但并非适于任何形式。如何选择可视化类型进行数据编码,这不只涉及美感和个人喜好。

通常,目的越明确,可采用的形式越少。下面介绍几个真实的例子阐述这个原则。

十几年前,我在西班牙的几家报社工作过,对他们的排版非常熟悉。他们的排版有一些固定模板,这是新闻传媒业的惯例:如果你知道每月都要发布一张关于失业率的信息图表或者每天都有一页用于天气预报,那么为何每次都要重新设计一张图表呢?运用模板节省时间。不幸的是,这种做法滋生惰性。一次次地使用模板让你不再深究它的结构和适用性,而仅仅是打开这个模板,更新数据并保存,而后关注那些更加有趣的材料。

图2.6的信息图表与西班牙许多报纸使用的模板类似,用于公布每月失业率。图表给出了所有数据,包含一个数据统计信息层,提供了数据概要。3种不同灰度色调分别代表高于平均值、等于平均值和低于平均值。

图2.6 失业率月变化图表

现在,我们通过一些问题对其进行评论。试着回答以下问题,每个问题的回答时间不能多于5秒。

1.哪个地区的失业率上升最快?

2.哪个地区下降最快?

3.马德里、拉里奥哈或加纳利的失业率有没有增加?

4.埃斯特雷马杜拉、安达卢西亚或巴利阿里的失业率降低量是否相对较多?

很可能,你回答不了这些问题。之前我设计这种图表时也没有问自己这些问题,但是现在我这样做了。我改变观念,从读者的角度思考问题,而不是从设计者的角度。作为读者,这些答案就是我利用这种图表工具想要得到的。

这张图表面临的问题与本节开头分析的图表类似。当你试图回答上面的任何一个问题时,将发生如下情况。

1.你的眼睛不停地搜寻问题中提到的那些数据。

2.用你的大脑记住这些数据。

3.在脑海中从大到小排列这些数据(或从小到大)。

4.在脑海中比较这些数据。

这需要很大的工作量。如果我们知道读者更关注他们自己所在地区的情况,何不事先这样做?图2.7使用了同样的数据,但是分析这些数据时你可以有多种选择。

图2.7 失业率变化图表

再看这张图:是否有必要这样做?可能需要。该例中,这些区域的失业率可能与地理位置相关,如图所示,西班牙东南部的失业率越来越高。

在2004年的季度技术交流访谈时,Edward Tufte探讨了有关可视化与信息设计(他更愿意将之称为分析设计)的最重要的理论,他将形式与功能的关系简要定义如下。

有效的分析设计必须从思考法则转变为懂得法则。因此,如果思考的目的是为了找出因果关系,那么需要这个设计原则——展示因果关系。如果思考的目的是为了回答问题或与其他作比较,那么这个原则就是——展示可比性。关键是,分析设计并非取决于使用者的便利性、读者的可读性、心理学家或装饰者的想法,而是其结构如何帮助思考和分析这些证据[6]

这个定义讲得很清楚。但是,像前面的例子一样,该观点也不尽然。运用Google将信息图表作为关键字进行简单搜索,会得到成千上万的项目链接,这些项目的设计者在选择图表形式时并没有考虑该形式对思考有多少帮助,而只是使其形式看起来很酷、有创意或者有趣。他们没有形成这样的重要技能,那就是问自己“我的图表用来干什么?”这些设计者很容易成为样式的牺牲品。正如我书中所写的,没有任何一种样式误导比泡泡来得更广泛。

相对于信息图表的运作方式,信息图表部门更应该考虑它们的形貌,新闻媒体界对泡泡图表的滥用就是一个很好的例子。讲述这个问题时,我通常以图2.8那样的图表为例,该图是基于《彭博资讯》(Bloomberg News)的一个真实项目。

图2.8 银行资金缩水的泡泡图表
灵感来源:Stephen Few,http://www.perceptualedge.com/articles/visual_
business_intelligence/our_fascination_with_all_things_circular.pdf

询问大家看见这张图表有什么感觉时,他们的回答通常是,“没有任何问题。很清楚,2007—2008年的金融危机期间,图中所有银行的资金均显著减少。”我同意,那也是我从这张图表中所看见的。随即,我展示了另外一张图表,如图2.9所示,并问,“如果你已经知道2007年Société Générale的市场资金总额是800亿美元,那么2009年的是多少?”(试着回答这个问题,但是不能查看图2.8。)

图2.9 Société Générale市场资金总额变化的泡泡图表

据我之前的经验,相信超过70%人的回答是比400亿美元多一些。也就是说,他们认为这个小泡泡的面积是大泡泡的一半。

现在转到图2.10,并且告诉被询问者,直条长度与泡泡面积代表的数据一样。通过这张图表很容易看出,2009年的资金总额大概是2007年的三分之一。看见这张图表时,他们很惊讶,表情非常有趣。

图2.10 Société Générale市场资金总额变化的条状图表

通过泡泡图表,为何大部分人高估了2009年的数据?因为人类的大脑不善于计算面积,而特别善于计算一维事物,如长度或高度。就像本书第2部分将会讲到的那样,大脑也是一个无可救药、懒惰的机器。一只熊向你跑来时,如果这只熊的体形庞大到足以构成威胁,毫无疑问,大脑会迅速对其进行分析和判断。对于图2.11,你希望读者比较的是左边的内容(面积);而事实上他们比较的是右边的内容(直径)。

图2.11 用于比较的泡泡图表

当我举例说明泡泡图表不利于大量数据间的准确比较时,经常听到这样的话,“你说的我懂,但是你使用障眼法,隐藏了所有数据。如果标出数据,就不会这样了。”确实如此,但是那个例子中的泡泡又有什么用呢?泡泡反而引起误导,它们让你低估了这个差距。回到图2.8,不看数据,你是否能够说出2009年的资金是2007年的二分之一?我肯定你不能。如果你像我一样心不在焉或者没有过多关注这张图表,你会得到与之相反的结论,认为Santander银行受金融危机的影响并不大。

如果这些泡泡没有功能性用途,何不制作一张简单并且可靠的表格?因为这些圆圈只是一种装饰,仅仅好看而已。

鉴于Edward Tufte将思维定律转换为设计定律的原则,设计图表是否还有其他方法?当然。正如我们先前讨论的,功能不一定决定形式。功能限制你的选择,但是你依然具有选择权。对于上面的银行数据,你可以设计一张图表,利用它不仅可以做比较,而且还可以关注两年间发生的变化(如图2.12所示)。

图2.12 银行的资金变化

用泡泡代表数据是否总是错误的?不是的。回顾我们最重要的定律:作为一种工具,应该根据目的选择信息图表的形貌。银行信息图表是为了帮助我们准确地进行资金比较。2004年美国总统大选后,《纽约时报》发布了图2.13所示图表。图中,每个圆圈代表John Kerry(蓝色)或George W. Bush(红色)在该地区赢得的选票数。在制图学中,这种地图称为比例符号图。

图2.13 适于全局可视化,便于识别模式和趋势的比例符号图表

为什么那张银行信息图表失效,而这张地图有用?原因就在于它们的目的。这张选票地图的目的不是为了让读者对代表曼哈顿和休斯顿的泡泡进行比较,这个任务由另外一张图表实现。该图表的目的是为了让读者对民主党与共和党的选票情况有大概了解。

通过本章的学习,我不希望给你们这样一种信号,即认为给每个内容选择正确的图表形式是一件容易的事情。提供一些绝对可靠的规则确实令人开心——随时间的变化,采用时间序列图表;需要比较,采用条状图表;展示相互关系,采用离散点图表——因为在这些规则中,有些部分确实非常有用。有实例可以说明采用某些图表能够实现一些特殊目的,如图2.14所示。

图2.14 3种常见图表:时间序列图表、柱状图表和离散点图表

严谨的规则可以将好的建议转变成固定定律,但现实是复杂的。每个实例运用这个定律时可以做一些特殊化处理和微小改动。有一点很重要,需要记住,那就是不论你希望信息图表与可视化多具创新性,设计前首先必须做的是,问问自己,读者可能会利用你的信息图表做什么

[1] Louis Sullivan, “The Tall Office Building Artistically Considered,” Lippincott’s Magazine, March, 1896, accessed Feb. 11, 2012, http://academics.triton.edu/faculty/fheitzman/tallofficebuilding.html.

[2] Carl Zimmer, At the Water’s Edge (New York: Touchstone,1999).

[3] 长颈鹿的故事并没有得到证实,但是合理的。参见“On the origin, evolution and phylogeny of giraffes Giraffa camelopardalis,” by G. Mitchell and J. D. Skinner, Transactions of the Royal Society South Africa, 58(1), 2003, pp. 51-72. Accessed Feb. 11, 2012 from http://www.bringyou.to/GiraffeEvolution.pdf

[4] Stephen Jay Gould and Elisabeth Vrba, “Exaptation – A Missing Term in the Science of Form, Paleontology,” 8(1), Winter, 1982, 4-15.

[5] Steven Johnson, Where Good Ideas Come From: The Natural History of Innovation (New York: Penguin Group, 2010).

[6] Mark Zachary and Chrlotte Thralls, “An Interview with Edward Tufte,” Technical Communication Quarterly, 2004, 13(4), 447-462. Accessed Feb. 11, 2012 at http://www.edwardtufte.com/tufte/s15427625tcq1304_5.pdf.


相关图书

Python数据科学实战
Python数据科学实战
数据分析实战:方法、工具与可视化
数据分析实战:方法、工具与可视化
Power BI数据挖掘与可视化分析
Power BI数据挖掘与可视化分析
从0到1——Python数据可视化
从0到1——Python数据可视化
善用图表——一看就懂的商业数据表达术
善用图表——一看就懂的商业数据表达术
从Power BI 到 Power Platform:低代码应用开发实战
从Power BI 到 Power Platform:低代码应用开发实战

相关文章

相关课程