大数据存储:MongoDB实战指南

978-7-115-37655-8
作者: 郭远威 彭文波
译者:
编辑: 陈冀康
分类: MongoDB

图书目录:

详情

本书是关于MongoDB数据库的指南,适合想了解MongoDB数据库和海量数据云计算存储平台的读者。本书介绍了云存储相关知识,包括MongoDB的优势功能、内部原理、特色应用等,对海量数据的可靠性存储进行了分析。基础功能方面讲解了数据模型、增删改查、索引及查询优化等内容;内部原理描述了Journaling日志如何提高数据完整性,复制集故障自动转移、数据冗余备份以及MongoDB分片集群等。

图书摘要

大数据存储 MongoDB实战指南
郭远威 著
人民邮电出版社

北京

前言

多年来,我一直在和数据库存储技术打交道,深知数据存储技术在整个IT系统中起着至关重要的作用,尤其是随着云计算时代的到来,所有企业都面临着海量的数据信息,如何处理这些数据成为当前研究的热点。在过去二十几年中,数据的存储是关系数据库的天下,它以高效、稳定、支持事务的优势几乎统治了整个行业的存储业务;但是随着互联网的发展,许多新兴产业如社交网络、微博、数据挖掘等业务快速增长,数据规模变得越来越庞大,高效存储、检索、分析这些海量的数据,关系数据库变得不再适用。前几年我们还可以看到网络上关于关系数据库与NoSQL数据库谁优谁劣的激烈讨论,如今NoSQL几乎占据了各大数据库论坛讨论的大部分版块。一些行业领头公司也逐渐将业务迁移到非关系数据库上,NoSQL类型的数据库也变得越来越成熟。当然,在未来一段时间里关系数据库如Oracle、DB、SQL Server等仍会在事务性要求比较高的行业(如银行、电信等)发挥它的作用。

另一方面,在信息技术领域,计算与存储一直是密不可分的,当前我们身处云计算的浪潮中,因此对应的各种云存储技术也呼之欲出。本书将介绍的NoSQL数据库MongoDB正是众多分布式海量数据存储技术中最出色的一种。MongoDB是一种面向文档的分布式数据库,可扩展,表结构自由,支持丰富的查询语句与数据类型,旨在为未来的大数据应用提供高性能的云存储解决方案。当然MongoDB幵不是万能的,随着了解的深入,我们也会发现它的缺点,这也是本书的宗旨,尽量让读者明白它的长处与短处,对于特定的业务选择最合适的数据库存储方案。最后我们希望本书介绍的MongoDB知识能为您在未来的项目中处理海量数据时提供帮助。

本书内容

本书尽量仍一个学习与实践者的角度,本着力求精简、突出精髓的原则,剖析了MongoDB在生产环境中使用需要知道的所有内容,全书分 部分,共章,每章的内容简单介绍如下。

第1章 本章主要从什么是MongoDB以及几个核心迚程两方面概述了MongoDB,使读者整体上对MongoDB的体系结构有个认识。

第2章 本章主要介绍了MongoDB的查询语言系统,包含各种查询选择器以及查询选项,这是对任何一个数据库都有的内容。

第3章 本章主要介绍了MongoDB的索引与查询优化。

第4章 本章主要介绍了MongoDB的增、删、改语句。

第5章 本章主要仍底层存储视图与写操作流程剖析了MongoDB的Journaling日志功能。

第6章 本章主要介绍了MongoDB的聚集分析框架与MapReduce的编程模型。

第7章 本章主要介绍了复制集的功能与工作机制,包含数据同步、故障转移、写关注等,这些是MongoDB的核心。

第8章 本章主要介绍了分片集群,包含部署架构、分片、读写分离、片键选择等内容,这是MongoDB不同于传统关系数据库地方,也是实现海量数据分布式存储的关键。

第9章 本章主要介绍了分布式文件系统的GridFS文件,实现二迚制数据的存储。

第10章 本章主要介绍了对MongoDB的管理与监控,包括数据的导入导出、备份恢复以及运行状态的监控。

第11章 本章主要介绍权限控制,实现不同数据库对不同角色用户的权限分配。

第12章 本章主要仍应用开发角度,介绍了MongoDB的PHP驱动接口。

第13章 本章主要介绍了一个完整的电商平台,数据库使用的是MongoDB幵对前面所有章节的知识迚行总结,内容包含电商平台数据库表的设计、核心代码的编写、前台界面的原型图设计等,还介绍了开发Web应用程序常用的PHp框架Codeigniter和前端开发框架Bootstrap等。

本书特色

● 注重实践,本书为多年一线数据库存储,部署开发经验的总结。

● 注重效率,本书用最精简的篇幅直接阐明问题的本质,节省宝贵的阅读时间。

● 注重基础,本书用计算机领域相关的基础理论知识来解释某些难于理解的概念。

● 案例丰富,本书使用完整的例子与代码注释,使读者可以直接上手操作。

● 把握未来,大数据势不可挡,本书介绍的MongoDB特性与此息息相关。

读者对象

● 有海量数据存储需求的人员。

● 数据库管理与开发人员。

● 数据挖掘与分析人员。

● 各类基于数据库的应用程序开发人员。

谨以此书献给热爱技术、热爱MongoDB的朋友们!

第一部分 基础知识

这一部分主要介绍 MongoDB 方面的基础知识,熟悉关系数据库的读者能够快速地认识到 MongoDB 是什么以及与其他数据库的区别,这一部分的基础知识很重要,贯穿整本书,建议多实践和测试。

第1章 本章介绍了大数据、云计算的基本概念以及云存储与 MongoDB的关系,还介绍了 MongoDB 是什么、它的特点以及如何在各种平台上部署MongoDB等,最后介绍了MongoDB部署启动后一些关键的进程。

第2章 本章介绍了各种查询操作,这是数据库上最常用的一个操作。MongoDB的查询与关系数据库的语法区别很大,但它们很多设计思想是相同的,查询选择器相当于关系数据库中经常用到的where语句,查询选项相当于过滤出需要返回的字段。最后介绍了一种特殊对象的查询操作,这在关系数据库中是没有的。

第3章 本章介绍了查询用到的索引以及利用索引对查询的优化,这个思想和关系数据库也是一致的,利用索引来提高查询效率。

第4章 本章介绍了对 MongoDB 插入、删除、修改操作,至此一系列完整的增删改查的操作都介绍完了,对于一般的应用程序开发都能支持了。

第1章 大数据与云计算

1.1 什么是大数据

对于各种规模大小的组织机构而言,由于数据爆炸式的增长,传统的数据处理技术变得越来越难适应,需要有变革的技术来存储、分析这些大数据。谁能够掌握这些存储、分析技术,谁就有可能成为未来市场的主导者。财富500强公司在这个方面已走在前列,他们认识到大数据不仅仅是一门技术,而且是未来商业的发展趋势,并且已经开始从创新的大数据业务中受益。例如,企业能够分析用户的Web点击习惯,总结出用户喜好,进而有针对性地开展促销;政府部门能够利用大数据预测疾病的传播趋势,进而提前进行干预。

具体来说,大数据技术涉及到数据的创造、存储、获取和分析,数据的主要特点有以下几个。

数据量大。一个典型的PC机在2000年前后其存储空间可能有10GB,今天Facebook一天增加的数据量就将近有 500TB;一架波音 737 的飞机围绕美国飞行一周将会产生240TB 的数据;移动互联网的发展,智能手机的普及,人们每时每刻都在产生数以百万计的数据。

数据变化快。高速的股票交易市场,产生的数据以微秒计算;基础设施系统、实施系统每秒都产生大量的变化的日志,每秒都处理大量的并发。

数据多样性。大数据的类型不仅仅是简单的数字、日期和字符串,它可能包含地理数据、3D数据、音视频以及无结构的文档,而且这么多类型的数据可能需要保存在一起。

大数据技术的战略意义不仅在于掌握庞大的数据信息,而且也在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键在于提高对数据的“存储和加工能力”,通过“加工”实现数据的“增值”。大数据技术能够利用修改过的硬件取代原来高消耗和昂贵的老系统。由于许多大数据技术是开源的,它们实施起来更快且更便宜,例如,将它的数据存储技术迁移到MongoDB上来。

1.2 什么是云计算

云计算的定义有多种说法,对于到底什么是云计算,我们至少可以找到100种解释。目前广为接受的是美国国家标准与技术研究院定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互,本质上就是虚拟化技术的延伸,以服务的形式提供客户。按照服务的形式,目前主要有如下3种形式的云计算。

1.IaaS:基础设施即服务

IaaS(Infrastructure-as-a-Service):基础设施即服务。消费者通过Internet可以从完善的计算机基础设施获得服务,例如硬件服务器租用。

2.SaaS:软件即服务

SaaS(Software-as-a- Service):软件即服务。它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。例如:阳光云服务器。

3.PaaS:平台即服务

PaaS(Platform-as-a- Service):平台即服务。PaaS 实际上是指将软件研发的平台作为一种服务,以SaaS的模式提交给用户。因此,PaaS也是SaaS模式的一种应用。但是PaaS的出现可以加快SaaS的发展,尤其是加快SaaS应用的开发速度,例如软件的个性化定制开发。

1.3 大数据与云计算

从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理,也就说大数据就像做饭用的一堆原材料,云计算就像做饭用的工具。云计算解决了大数据的运算工具问题,而对大数据的存储我们需要相应的云存储工具。云存储是在云计算概念上延伸和发展出来的一个新的概念,是指通过集群应用或分布式文件系统等功能,将网络中大量的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。所以云存储是一个以数据存储和管理为核心的云计算系统,本书介绍的MongoDB就可以当作一个云存储系统使用。

1.4 什么是MongoDB

MongoDB是一个可扩展、开源、表结构自由、用C++语言编写且面向文档的数据库,旨在为Web应用程序提供高性能、高可用性且易扩展的数据存储解决方案。

MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富、最像关系数据库的 NoSQL 数据库;它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,可以实现类似关系数据里单表查询的绝大部分功能,而且还支持对数据建立索引。

MongoDB不是在实验室里面凭空想象出来的产品,它是10gen公司的工程师根据实际的需求而设计的,主要基于以下几点考虑,需要一种新的数据库技术来满足数据存储层的水平扩展,而且要容易开发,能够存储海量的数据;一种非关系的结构是使数据库能支持水平扩展的最好方案;文档数据模型(BSON)容易编码和管理,将内部相关的数据放在一起能够提高数据库的操作性能。

MongoDB 服务端可运行在 Linux、Windows 或 OS X 平台,支持 32 位和 64 位应用,默认监听端口为 27017。MongoDB 的内存管理依赖于操作系统的自动内存管理机制,而且通过Map对数据文件进行内存映射,因此推荐MongoDB运行在64位平台上,否则在32位模式受虚拟内存地址大小的限制,而且运行时支持的最大文件尺寸也只能为2GB。当然对于测试和开发环境我们可以在 32 位模式下进行,生产环境上最好是部署在64位上。

MongoDB发展迅速,无疑是当前NoSQL领域的人气王,就算与传统的关系数据库比较也不甘落后,数据库知识网站DB-Engines根据搜索结果对223个数据库系统进行流行度排名,2014年7月的数据库流行度排行榜前12名如图1-1所示。

我们可以看到前三甲依然是Oracle、MySQL 和微软的SQL Server,值得关注的是,第五名MongoDB与第四名PostgreSQL之间的积分差距已不足1分。前四名由于历史原因都是关系数据库,许多大型的垄断行业仍然在使用这些关系数据库。

图1-1 2014年7月DB-Engines上的数据库排行榜

MongoDB只通过6年时间就将公司市值发展到12亿美元,其成果相当于著名开源公司Red Hat 20 年的发展。MongoDB 的成功之路,一大部分归功于Web开发者。作为一个面向文档数据库,在许多场景下它都优于 RDBMS,同时还可以获得非常高的读写性能。此外,动态、灵活的模式更可以让用户在商用服务器上轻松地进行横向扩展。

1.5 大数据与MongoDB

大数据意味着新的机会,企业能够创造新的商业价值。MongoDB这样的数据库可以支撑很多大数据系统,它不仅可以作为一个实时的可操作的大数据存储系统,也能在离线大数据分析系统中使用。利用MongoDB作为大数据的云存储系统,企业能够在全世界范围内存储更多的数据,吸引更多的用户,挖掘更多用户的喜好,创造更多的价值。

选择正确的大数据存储技术,对使用者的应用和目标是非常重要的。MongoDB 公司提供的产品和服务能让使用者担更少的风险、花更少的精力提供更好的生产系统产品。事实上,MongoDB 天生就是为云计算而生的,其原生的可扩展架构,通过启用分片和水平扩展,能提供云存储所需的技术;此外,它的自动管理被称为“副本集”的冗余服务器,以保持数据的可用性和完整性。MongoDB 目前已经成为多家领先的云计算供应商,其中包括亚马逊网络服务、微软和SoftLayer等。

MongoDB还支持Google提出的MapReduce并行编程模式,为大数据的分析提供了强有力的保障。MongoDB同时提供了与Hadoop的接口,与其他第三方数据分析工具完美结合。

1.6 MongoDB特点

它的存储模型与关系数据库的比较如表1-1所示。

表1-1 MongoDB存储模型与MySQL的对比

关系数据库中最基本的单元是行,而MongoDB中最基本存储单元是document,典型结构如下所示。

{

"_id" : ObjectId("51e0c391820fdb628ad4635a"),

"author" : { "name" : "Jordan","email" : "Jordan@123.com" },

"postcontent" : "jordan is the god of basketball",

"comments" : [

{"user" : "xiaoming", "text" : "great player"},

{ "user" : "xiaoliang", "text" : "nice action" }

]

}

它用与JSON格式类似的键值对来存储(在MongoDB中叫BSON对象),其中值的数据类型有常见的字符串、数字、日期,还可以是BSON对象、数组以及数组的元素,也可以是BSON对象,通过这种嵌套的方式,使MongoDB的数据类型变得相当丰富。

MongoDB 与传统关系数据库还有一个重大区别就是:可扩展的表结构。也就是说collection(表)中的document(一行记录)所拥有的字段(列)是可以变化的,下面文档对象document(一行记录)比上面列出的文档对象document(一行记录)多一个time字段,但它们可以共存在同一个collection(表)中。

{

"_id" : ObjectId("51e0c391820fdb628ad4635a"),

"author" : { "name" : "Jordan","email" : "Jordan@123.com" },

"postcontent" : "jordan is the god of basketball",

"comments" : [

{"user" : "xiaoming", "text" : "great player"},

{ "user" : "xiaoliang", "text" : "nice action" }

],

"time": "2013-07-13"

}

MongoDB查询语句不是按照SQL的标准来开发的,它围绕JSON这种特殊格式的文档型存储模型开发了一套自己的查询体系,这就是现在非常流行的 NoSQL 体系。关系数据库中常用的 SQL 语句在 MongoDB 中都有对应的解决方案。当然也有例外,MongoDB不支持JOIN语句。我们知道传统关系数据库中JOIN操作可能会产生笛卡尔积的虚拟表,消耗较多系统资源,而MongoDB的文档对象集合collection可以是任何结构,我们可以通过设计较好的数据模型尽量避开这样的操作需求。如果真的需要从多个collection(表)中检索数据,那我们可以通过多次查询得到。

在关系数据库中经常用到的 group by 等分组聚集函数,在 MongoDB 中也有,而且MongoDB提供了更加强大的MapReduce方案(GOOGLE提出的并行编程),为海量数据的统计、分析提供了便利。

MongoDB支持日志功能Journaling,对数据库的增、删、改操作会记录在日志文件中。MongoDB 每100ms将内存中的数据刷到磁盘上,如果意外停机,在数据库重新启动时, MongoDB能通过Journaling日志功能恢复。

MongoDB支持复制集(Replset),一个复制集在生产环境中最少需要3台独立的机器(测试的时候为了方便可能都部署在一台机器上),一台作主节点(primary),一台作次节点(secondary),一台 作仲裁节点(只负责选出主节点),备份、自动故障转移,这些特性都是复制集支持的。

MongoDB支持自动分片Sharding,分片的功能实现海量数据的分布式存储,分片通常与复制集配合起来使用,实现读写分离、负载均衡,当然如何选择片键是实现分片功能的关键。如何实现读写分离我们后面会详细分析。

总之,MongoDB 最吸引人的地方应该就是自由的表结构、MapReduce、分片、复制集,通过这些功能实现海量数据的存储、高效地读写以及数据的分析。

1.7 安装MongoDB

MongoDB 官方已经提供了Linux、Windows、Mac OS X 以及Solaris 4 种平台的二进制分发包,最新的稳定版本是 2.6.3,下载地址是:http://www.mongodb.org/downloads ,如图1-2所示。

图1-2 各平台二进制分发包

下载完成后,解压,我们就能直接运行里面的二进制文件,这里所讨论的安装MongoDB,一般指的是运行MongoDB服务器端的进程mongod。

解压后,在bin目录下,我们可以看到一个名为mongod.exe的可执行程序,这个就是服务器端进程对应的程序。因为MongoDB启动时需要指定数据文件所在的目录,所以先要建立一个保存数据文件的目录,如 D:\mongodb-win32-i386-2.6.3\ test_single_instance\data;启动时也可以指定一个日志文件,如D:\ mongodb-win32-i386-2.6.3\test_single_instance\logs\ 123.log,我们通过以下命令就可以启动。

> mongod --config E:\MongoDB-win32-i386-2.6.3\test_single_instance\123.conf

上述步骤在Linux平台上也是一样的,只不过要注意目录和文件的读写权限。

还有一种安装方式就是直接通过各 Linux 分发版本对应的包管理器,如 RedHat、Debian、Ubuntu等都有自己的包管理器,通过包管理器安装时,系统会自动创建数据目录和日志文件,找到这些目录和文件所在的位置,后续分析问题可能会经常要读取日志文件。

1.8 几个重要的进程介绍

通过官网下载的二进制包中有几个重要的可执行文件,这些可执行文件运行后都会对应一个相应的进程。

1.8.1 mongod进程

Mongod.exe为启动此数据库实例进程对应的可执行文件,是整个MongoDB中最核心的内容,负责数据库的创建、删除等各项管理工作,运行在服务器端为客户端提供监听,相当于MySQL数据库中的mysqld进程。

启动数据库实例会用到以下命令。

>mongod --config E:\MongoDB-win32-i386-2.6.3\test_single_instance\123.conf

配置文件123.conf内容如下所示。

dbpath = E:\MongoDB-win32-i386-2.6.3\test_single_instance\data

logpath = E:\MongoDB-win32-i386-2.6.3\test_single_instance\logs\123.log

journal = true

port = 50000

auth = true

dbpath为数据库文件存储路径;logpath为数据库实例启动、运行、错误日志文件;journal启动数据库实例的日志功能,数据库宕机后重启时依赖它恢复;port 数据库实例的服务监听端口;auth启动数据库实例的权限控制功能。其他可选参数可以通过mongod–help查看。

1.8.2 mongo进程

mongo是一个与mongod 进程进行交互的JavaScript Shell进程,它提供了一些交互的接口函数用于系统管理员对数据库系统进行管理,如下面命令所示。

>mongo --port 50000–username xxx–password xxx–authenticationDatabase admin

mongo的参数port为mongod进程监听的端口,参数username为连接数据库的用户名,参数password为连接数据库的密码,参数authenticationDatabase为要连接的数据库。上述命令连接成功后,进程就会提供给用户一个JavaScript Shell环境,通过一些函数接口来管理数据库,其他参数可通过mongo--help选项查看。

1.8.3 其他进程

1.mongodump 提供了一种从 mongod 实例上创建 BSON dump 文件的方法,mongorestore能够利用这些dump文件重建数据库,常用命令格式如下。

mongodump --port 50000 --db eshop --out e:\bak

参数--port表示mongod实例监听端口,--db表示数据库名称,--out表示备份文件保存目录,更多可选参数可通过mongodump–help查看。

2.mongoexport是一个将MongoDB数据库实例中的数据导出来生产JSON或CSV文件的工具,常用命令格式如下。

mongoexport --port 50000 --db eshop --collection goods --out e:\goods.json

3.mongoimport是一个将JSON或CSV文件内容导入到MongoDB实例中的工具,常用命令格式如下。

mongoimport --port 50000 --db eshop --collection goods --file e:\goods.json

4.mongos 是一个在分片中用到的进程。所有应用程序端的查询操作都会先由它分析,然后将查询定位到具体某一个分片上,它的作用与mongod类似,客户端的mongo与它连接。

5.mongofiles提供了一个操作MongoDB分布式文件存储系统的命令行接口,常用命令如下。

mongofiles--port 40009 --db mydocs --local D:\算法导论学习资料.pdf put algorithm_introduction.pdf

它表示将本地文件D:\算法导论学习资料.pdf上传到数据库mydoc中保存。

6.mongostat 提供了一个展示当前正在运行的 mongod 实例的状态工具,相当于UNIX/Linux上的文件系统工具vmstat,但是它提供的数据只与运行着的mongod或mongos的实例相关。

7.mongotop提供了一个分析MongoDB 实例花在读写数据上的时间的跟踪方法。它提供的统计数据在每一个collection(表)级别上。

1.9 适合哪些业务

当前各行各业都离不开数据的存储与检索需求,传统关系数据库发展了这么多年,在有些垄断性行业如电信、银行等仍然是首选,因为这些行业需要数据的高度一致性,只有支持事务的数据库才能满足它们的要求。但随着这几年互联网业务的发展,数据量越来越大,并发请求也越来越高,一个大系统中只用一种数据库并不能很好地满足全部业务的发展,同时以MongoDB为代表的NoSQL数据库快速发展,在某些方面展示了它们的优越性,逐渐被采用并取代了系统中的某些部件,总的来说以下几个方面比较适合使用 MongoDB这类的数据库。

1.Web应用程序

Web应用是一种基于BS模式的程序,业务的特点是读写请求都比较高,早期系统的数据量可能很少,但是发展到一定程度后数据量会暴增,这就需要数据存储架构能够适应业务的扩展。传统的关系数据库表结构都是固定的,增加一个业务或者横向扩展数据库都会带来巨大的工作量。MongoDB 支持无固定结构的表模型,因此很容易增加或减少表中的字段,适应业务的变化;同时MongoDB本身就支持分片集群,很容易实现水平扩展,将数据分散到集群中的各个片上,提高了系统的存储容量和读写吞吐量。Web应用程序还有一个特点就是“热数据”读并发很高,也就是说最新的数据被请求的次数会最多。为了提供读的性能,在传统的关系数据将中会采用其他的缓存技术来将这部分数据放在内存中,而MongoDB本身就支持这一点,它是通过内存映射数据文件来实现的。它会维护一个工作集,将最热的数据放在内存中,不需要其他技术的协助,这为系统开发提供了简便性,如图1-3所示。

图1-3 Web应用中的MongoDB架构

2.缓存系统

这种使用场景是与关系数据库搭配使用,作为关系数据库的缓存前端。目前缓存技术有很多种,最常见的就是使用memcached,但是这些缓存系统都有个缺点,就是支持的数据类型有限,查询语句也有限,只能保存少量的数据且不能持久化。而MongoDB这些都能支持,因此可以作为缓存使用,如图1-4所示。

图1-4 MongoDB作为关系数据库的缓存使用

3.日志分析系统

这类系统的特点是数据量大,允许部分数据丢失,不会影响整个系统的可靠性。以前将日志直接保存到操作系统的文件上,我们需要用其他工具打开日志文件或编写工具读日志进行分析,这样的话对于大量的日志查询会比较困难。如果用MongoDB数据库来保存这些日志,一来可以利用分片集群使日志系统的容量海量大,二来使用MongoDB特有的查询语句能够快速找到某条日志记录。最重要的是MongoDB支持聚集分析甚至 MapReduce的能力,为大数据的分析和决策提供了强有力的支持,如图1-5所示。

图1-5 日志系统中的MongoDB应用

1.10 小结

MongoDB 是一个面向文档的数据库,不支持关系数据库中的 join 操作和事务。它用集合的概念代替了关系数据库中的表,用最小逻辑单元文档代替关系数据库中的行。它的集合结构是动态的,没有必要像关系数据库一样插入数据前先定义表结构,而且可以随时增加、修改、删除组成文档的字段。

MongoDB 支持当前所有主流编程语言的客户端驱动,使用方便,应用广泛,非常适合文档管理系统的应用、移动APP应用、游戏开发、电子商务应用、分析决策系统、归档和日志系统等应用。MongoDB支持所有主流平台的安装,但在32位的平台上部署时会有所限制,这是由它采用内存映射数据文件机制决定的,生产环境中最好部署在64位平台上。

图书在版编目(CIP)数据

大数据存储:MongoDB实战指南/郭远威著.--北京:人民邮电出版社,2015.2

ISBN 978-7-115-37655-8

Ⅰ.①大… Ⅱ.①郭… Ⅲ.①关系数据库系统—指南 Ⅳ.①TP311.138-62

中国版本图书馆CIP数据核字(2014)第299457号

内容提要

MongoDB是一种面向文档的分布式数据库。时至今日,MongoDB以其灵活的数据存储方式逐渐成为IT行业非常流行的一种非关系型数据库(NoSQL)。

本书从学习与实践者的视角出发,本着通俗精简、注重实践、突出精髓的原则,精准剖析了MongoDB的诸多概念和要点。全书共分4个部分,分别从基础知识、深入理解MongoDB、监控与管理MongoDB和应用实践几个维度详细地介绍了MongoDB的特点及应有实例。

本书适合有海量数据存储需求的人员、数据库管理开发人员、数据挖掘与分析人员以及各类基于数据库的应用开发人员阅读。读者将从书中获得诸多实用的知识和开发技巧。

◆著 郭远威

责任编辑 陈冀康

责任印制 张佳莹 彭志环

◆人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

三河市海波印务有限公司印刷

◆开本:800×1000 1/16

印张:11.75

字数:220千字  2015年2月第1版

印数:1-3500册  2015年2月河北第1次印刷

定价:39.00元

读者服务热线:(010)81055410 印装质量热线:(010)81055316

反盗版热线:(010)81055315

相关图书

MongoDB入门经典
MongoDB入门经典

相关文章

相关课程