目 录
第 一篇 关系数据库
第 1章 关系数据库概述 2
1.1 关系数据库发展历程 2
1.1.1 数据管理的发展阶段 2
1.1.2 关系数据库管理系统的主要特点 3
1.1.3 传统关系数据库的瓶颈 4
1.2 关系数据库核心概念 5
1.3 关系代数 6
1.3.1 传统的集合运算 6
1.3.2 专门的关系运算 7
1.4 E-R模型 8
1.4.1 E-R模型主要概念 9
1.4.2 建模过程 9
1.4.3 E-R模型的优点 10
习题 10
第 2章 达梦数据库的安装部署 11
2.1 达梦数据库的安装 11
2.1.1 安装前环境准备 11
2.1.2 软件安装步骤 17
2.2 达梦数据库的卸载 24
2.3 创建数据库实例 28
2.3.1 使用达梦数据库配置助手创建数据库实例 28
2.3.2 使用dminit命令创建数据库实例 37
2.4 管理数据库实例 38
2.4.1 启动数据库实例 38
2.4.2 关闭数据库实例 40
习题 43
第3章 关系数据库标准语言SQL 44
3.1 SQL简介 44
3.2 DDL 46
3.2.1 DDL下的表操作 46
3.2.2 修改表 53
3.2.3 删除表 54
3.2.4 创建视图 55
3.2.5 修改视图 56
3.2.6 删除视图 56
3.2.7 创建索引 57
3.2.8 修改索引 58
3.2.9 删除索引 59
3.3 DML 60
3.3.1 INSERT 60
3.3.2 UPDATE 60
3.3.3 DELETE 61
3.3.4 SELECT 61
习题 71
第4章 表空间管理 72
4.1 数据库的体系结构 72
4.1.1 数据库的物理存储结构 72
4.1.2 数据库的逻辑存储结构 75
4.2 表空间 76
4.2.1 创建表空间 77
4.2.2 维护表空间 81
习题 87
第5章 安全管理 88
5.1 数据库安全管理概述 88
5.2 用户管理 88
5.2.1 用户相关的概念 88
5.2.2 创建和修改用户 89
5.2.3 权限管理 100
5.2.4 删除用户 109
5.3 角色管理 111
5.3.1 角色相关概念 111
5.3.2 角色创建与查询 113
5.3.3 角色管理 117
5.3.4 角色删除 122
习题 123
第二篇 非关系数据库
第6章 非关系数据库概述 126
6.1 非关系数据库的发展与特点 126
6.1.1 非关系数据库发展历史 126
6.1.2 非关系数据库的特点 127
6.2 非关系数据库核心技术 127
6.2.1 键值存储数据库核心技术 127
6.2.2 列存储数据库核心技术 128
6.2.3 文档型数据库核心技术 129
6.2.4 图数据库核心技术 129
6.3 关系数据库与非关系数据库的区别 130
6.3.1 数据存储方式 130
6.3.2 适用场景 130
6.3.3 扩展性 131
6.3.4 数据一致性 131
习题 132
第7章 Hadoop的核心组件和集群部署 133
7.1 Hadoop分布式文件系统 133
7.1.1 HDFS读数据流程 135
7.1.2 HDFS写数据流程 136
7.1.3 HDFS副本存放策略 137
7.2 Hadoop资源管理系统 138
7.2.1 YARN的基本架构 139
7.2.2 YARN的工作原理 140
7.2.3 YARN的资源调度器 142
7.3 Hadoop集群部署流程 146
7.3.1 环境准备 146
7.3.2 安装Java环境 146
7.3.3 安装Hadoop 147
7.3.4 配置Hadoop集群 147
7.3.5 启动Hadoop集群 148
7.3.6 验证Hadoop集群 149
7.3.7 注意事项 149
习题 150
第8章 Hadoop分布式计算框架 151
8.1 MapReduce概述 151
8.1.1 MapReduce基本设计思想 151
8.1.2 MapReduce的优势和劣势 153
8.1.3 MapReduce编程模型 154
8.2 MapReduce运行机制 157
8.2.1 MapReduce作业运行机制 157
8.2.2 作业失败与容错 159
8.2.3 开发案例 160
习题 162
第9章 Hadoop分布式集群搭建 163
9.1 集群规划 163
9.2 HDFS集群搭建 165
9.2.1 HDFS集群配置 165
9.2.2 HDFS集群的启动和停止 170
9.3 YARN集群搭建 171
9.3.1 YARN集群配置 171
9.3.2 YARN集群的启动和停止 175
习题 175
第 10章 ZooKeeper分布式协调服务 177
10.1 ZooKeeper简介 177
10.2 ZooKeeper集群的架构设计 177
10.2.1 基本架构 177
10.2.2 设计目的 179
10.3 ZooKeeper核心原理 179
10.3.1 ZAB协议 179
10.3.2 ZooKeeper数据模型 182
10.3.3 会话 184
10.3.4 事件监听器 184
10.3.5 ACL权限 185
10.4 ZooKeeper的安装部署 185
10.4.1 ZooKeeper下载 185
10.4.2 以独立模式安装部署 186
10.4.3 以集群模式安装部署 189
习题 191
第 11章 HBase及Hive 193
11.1 初识HBase 193
11.1.1 HBase的概念 193
11.1.2 HBase的特性 193
11.2 HBase数据模型及基本架构 194
11.2.1 HBase数据模型的核心概念 194
11.2.2 核心概念的实例剖析 195
11.2.3 HBase的核心功能模块 196
11.3 HBase集群规划 198
11.4 初识Hive 199
11.4.1 Hive概述 199
11.4.2 数据仓库 199
11.4.3 Hive和Hadoop的关系 200
11.4.4 Hive和普通关系数据库的异同 201
11.5 Hive的原理及架构 202
11.5.1 Hive的设计原理 202
11.5.2 Hive的体系架构 203
11.5.3 Hive的运行机制 204
11.5.4 Hive编译器的运行机制 205
11.5.5 Hive的优缺点 205
11.5.6 Hive的数据类型 206
11.5.7 Hive的数据存储 206
习题 207
第三篇 实战篇
第 12章 数据中心解决方案 210
12.1 认识DMDIS 210
12.1.1 DMDIS简介 210
12.1.2 DMDIS应用场景 210
12.1.3 DMDIS版本介绍 212
12.1.4 DMDIS体系架构 212
12.1.5 将Hadoop数据抽取到达梦数据库 214
12.2 数据前端可视化 216
12.2.1 系统架构 216
12.2.2 产品特性与优势 217
习题 220