- 电子工业出版社
- 9787121316197
- 1-7
- 206270
- 48245072-3
- 平塑
- 16开
- 2022-12
- 472
- 292
- 工学
- 软件工程
- TP311.13
- 计算机科学与技术
- 本科 研究生(硕士、EMBA、MBA、MPA、博士)
目录
__eol____eol__目 录 __eol____eol__第1章 大数据库概述 1__eol__1.1 传统关系型数据库面临的问题 1__eol__1.2 大数据库技术 2__eol__1.2.1 列式数据库 2__eol__1.2.2 内存数据库 2__eol__1.2.3 键值数据库 3__eol__1.2.4 流式数据库 3__eol__1.3 大数据SQL 3__eol__1.4 当前主流大数据SQL简介 4__eol__1.4.1 Hive 4__eol__1.4.2 Impala 5__eol__1.4.3 Shark 6__eol__1.4.4 Spark SQL 7__eol__1.5 本章总结 8__eol__习题 9__eol__参考文献 9__eol__第2章 分布式数据库HBase 10__eol__2.1 HBase基础 10__eol__2.1.1 体系架构 10__eol__2.1.2 数据模型 15__eol__2.2 HBase操作简介 17__eol__2.2.1 HBase接口简介 17__eol__2.2.2 HBase Shell实战 17__eol__2.2.3 HBase API 20__eol__2.3 HBase实战 21__eol__2.3.1 实战HBase之综例 21__eol__2.3.2 实战HBase之使用MapReduce构建索引 22__eol__习题 26__eol__参考文献 27__eol__第3章 数据仓库工具Hive 28__eol__3.1 Hive简介 28__eol__3.1.1 工作原理 28__eol__3.1.2 体系架构 29__eol__3.1.3 计算模型 30__eol__3.1.4 Hive部署模式 31__eol__3.2 Hive的使用 32__eol__3.2.1 Hive的数据类型 32__eol__3.2.2 Hive接口汇总 32__eol__3.3 实战Hive Shell 33__eol__3.3.1 DDL操作 33__eol__3.3.2 DML操作 34__eol__3.3.3 SQL操作 34__eol__3.4 实战Hive之复杂语句 35__eol__3.5 实战Hive之综合示例 37__eol__3.6 实战Hive API接口 38__eol__3.6.1 UDF编程示例 38__eol__3.6.2 UDAF编程示例 39__eol__习题 40__eol__参考文献 41__eol__第4章 大数据查询系统Impala 42__eol__4.1 Impala简介 42__eol__4.1.1 Impala的起源 42__eol__4.1.2 Impala的特点 42__eol__4.1.3 Impala 前辈及竞争对手 43__eol__4.2 Impala工作原理 43__eol__4.2.1 Impala 设计目标 44__eol__4.2.2 Impala 服务器组件 44__eol__4.2.3 Impala 编程特点 45__eol__4.2.4 Impala在Hadoop生态圈中的生存之道 45__eol__4.3 Impala环境搭建 46__eol__4.3.1 Impala 安装前的考虑 47__eol__4.3.2 Impala 安装途径与安装示范 50__eol__4.4 Impala操作实例 61__eol__4.4.1 Impala 基本操作 62__eol__4.4.2 Impala 数据库操作 62__eol__习题 66__eol__参考文献 66__eol__第5章 内存数据库Spark 67__eol__5.1 Spark简介 67__eol__5.1.1 Spark的引入 67__eol__5.1.2 Spark生态系统BDAS 69__eol__5.1.3 Spark系统架构 75__eol__5.1.4 Spark工作流程 77__eol__5.1.5 Spark应用案例 78__eol__5.2 Spark计算模型 80__eol__5.2.1 Spark程序模型 81__eol__5.2.2 弹性分布式数据集(RDD) 81__eol__5.2.3 Spark算子 84__eol__5.3 Spark工作机制 85__eol__5.3.1 Spark运行机制 85__eol__5.3.2 Spark调度机制 87__eol__5.3.3 Spark I/O机制 93__eol__5.3.4 Spark通信机制 94__eol__5.3.5 Spark容错机制 97__eol__5.3.6 Spark Shuffle机制 101__eol__5.4 Scala快速入门 102__eol__5.4.1 Scala解释器 103__eol__5.4.2 变量 103__eol__5.4.3 函数 104__eol__5.4.4 编写Scala脚本 105__eol__5.4.5 while 配合if实现循环 105__eol__5.4.6 foreach和 for 来实现迭代 105__eol__5.4.7 类型参数化数组 106__eol__5.4.8 Lists 107__eol__5.4.9 使用元组(Tuples) 108__eol__5.4.10 Sets和Maps 108__eol__5.4.11 函数编程风格 109__eol__5.4.12 读取文件 110__eol__5.5 Spark环境部署 110__eol__5.5.1 安装与配置Spark 110__eol__5.5.2 Intellij IDEA构建Spark开发环境 118__eol__5.5.3 SBT构建Spark程序 121__eol__5.5.4 编译Spark程序 122__eol__5.5.5 远程调试Spark程序 123__eol__5.5.6 生成Spark部署包 124__eol__5.6 Spark 编程案例 124__eol__5.6.1 WordCount 125__eol__5.6.2 Top K 127__eol__5.6.3 倒排索引 128__eol__习题 130__eol__参考文献 131__eol__第6章 Spark SQL 132__eol__6.1 Spark SQL简介 132__eol__6.1.1 Spark SQL发展历程 132__eol__6.1.2 Spark SQL 架构 133__eol__6.2 Spark SQL编程基础 137__eol__6.2.1 数据类型及表达式 137__eol__6.2.2 Spark SQL查询引擎Catalyst 138__eol__6.2.3 SQL DSL API 142__eol__6.2.4 Spark SQL ThriftServer和CLI 144__eol__6.2.5 Spark SQL常用操作 146__eol__6.3 Spark SQL实战 151__eol__6.3.1 Spark SQL开发环境搭建 151__eol__6.3.2 Spark SQL使用入门 166__eol__习题 173__eol__参考文献 173__eol__第7章 键值数据库 174__eol__7.1 概述 174__eol__7.1.1 键值存储 174__eol__7.1.2 键值数据库 176__eol__7.2 Redis 178__eol__7.2.1 简介 178__eol__7.2.2 Redis数据服务及集群技术 180__eol__7.2.3 Redis安装 186__eol__7.2.4 Redis数据操作 187__eol__7.2.5 案例:网站访问历史记录查询 193__eol__7.3 Memcached 198__eol__7.3.1 简介 198__eol__7.3.2 Memcached缓存技术 198__eol__7.3.3 Memcached安装 200__eol__7.3.4 Memcached数据操作 203__eol__7.3.5 Memcached分布式技术 206__eol__7.3.6 案例:论坛帖子信息缓存 207__eol__7.4 典型应用及局限 208__eol__7.4.1 典型应用 209__eol__7.4.2 键值数据库局限 211__eol__习题 211__eol__参考文献 212__eol__第8章 流式数据库 213__eol__8.1 流式计算模型 213__eol__8.1.1 流式计算概念 213__eol__8.1.2 流式计算数据特点 215__eol__8.1.3 流式计算典型应用 216__eol__8.1.4 典型流式计算平台 216__eol__8.2 流式计算关键技术 218__eol__8.2.1 计算拓扑 218__eol__8.2.2 消息传递 220__eol__8.2.3 高可用性 222__eol__8.2.4 语义保障 224__eol__8.2.5 其他关键技术 225__eol__8