Hadoop大数据平台技术与应用
¥59.00定价
作者: 孙风栋
出版时间:2024-01
出版社:电子工业出版社
- 电子工业出版社
- 9787121413650
- 1-6
- 421582
- 48253452-6
- 平塑
- 16开
- 2024-01
- 490
- 292
- 工学
- 计算机科学与技术
- 计算机科学与技术
- 本科
目录
第1章 大数据技术与Hadoop概述__eol__1.1 大数据技术概述 __eol__1.1.1 大数据技术发展__eol__1.1.2 大数据基本特征__eol__1.1.3 大数据关键技术__eol__1.1.4 大数据技术应用__eol__1.2 Hadoop概述__eol__1.2.1 Hadoop简介__eol__1.2.2 Hadoop核心组件__eol__1.2.3 Hadoop生态圈组件 __eol__1.2.4 Hadoop架构__eol__本章小结__eol__思考题与习题__eol__第2章 Hadoop平台和开发环境的安装与配置__eol__2.1 Hadoop平台安装准备 __eol__2.1.1 VMware安装与配置__eol__2.1.2 Ubuntu安装与配置__eol__2.1.3 网络配置__eol__2.2 Hadoop伪分布式集群安装与配置__eol__2.2.1 创建用户hadoop__eol__2.2.2 修改主机名与域名映射__eol__2.2.3 SSH免密码登录设置__eol__2.2.4 安装Java环境 __eol__2.2.5 伪分布式集群安装与配置__eol__2.3 Eclipse开发环境安装与配置__eol__2.3.1 Maven安装与配置__eol__2.3.2 Eclipse安装与配置__eol__2.3.3 Eclipse中Maven设置__eol__本章小结__eol__思考题与习题__eol__第3章 分布式文件系统__eol__3.1 HDFS概述__eol__3.1.1 HDFS架构__eol__3.1.2 HDFS设计目标__eol__3.1.3 HDFS高可用架构__eol__3.1.4 HDFS架构的优劣性__eol__3.2 HDFS工作机制 __eol__3.2.1 HDFS数据存储策略__eol__3.2.2 HDFS数据读取策略__eol__3.2.3 HDFS数据错误与恢复__eol__3.2.4 HDFS数据读写过程__eol__3.3 HDFS Shell管理__eol__3.3.1 HDFS文件操作命令__eol__3.3.2 HDFS系统管理命令__eol__3.3.3 HDFS Shell操作实例__eol__3.4 HDFS Java开发 __eol__3.4.1 HDFS Java程序设计基础 __eol__3.4.2 HDFS程序设计流程__eol__3.4.3 常用HDFS Java API __eol__3.4.4 HDFS开发实例__eol__本章小结__eol__思考题与习题__eol__第4章 MapReduce__eol__4.1 MapReduce概述 __eol__4.1.1 MapReduce简介__eol__4.1.2 MapReduce计算模型__eol__4.1.3 MapReduce编程模型__eol__4.2 MapReduce架构 __eol__4.2.1 MapReduce V1架构 __eol__4.2.2 MapReduce V2架构 __eol__4.3 MapReduce编程组件__eol__4.3.1 MapReduce编程流程__eol__4.3.2 InputFormat__eol__4.3.3 InputSplit__eol__4.3.4 RecordReader__eol__4.3.5 Mapper__eol__4.3.6 Shuffle__eol__4.3.7 Reducer__eol__4.3.8 OutputFormat__eol__4.3.9 序列化与反序列化__eol__4.4 WordCount程序设计实例__eol__4.4.1 准备输入文件__eol__4.4.2 创建Maven工程__eol__4.4.3 配置Maven工程__eol__4.4.4 程序设计__eol__4.4.5 工程打包、部署与运行__eol__4.4.6 定制WordCount程序设计__eol__4.5 MapReduce开发典型案例__eol__4.5.1 数据去重__eol__4.5.2 数据排序__eol__4.5.3 计算平均值__eol__4.6 网站浏览量统计分析__eol__本章小结__eol__思考题与习题__eol__第5章 分布式数据库HBase__eol__5.1 HBase概述__eol__5.1.1 HBase简介__eol__5.1.2 HBase特性__eol__5.1.3 HBase适用场景__eol__5.2 HBase数据模型 __eol__5.2.1 HBase基本概念__eol__5.2.2 概念视图__eol__5.2.3 物理视图__eol__5.3 HBase体系结构 __eol__5.4 HBase安装与配置__eol__5.4.1 HBase运行模式__eol__5.4.2 HBase安装准备__eol__5.4.3 HBase伪分布式集群安装与配置__eol__5.5 HBase Shell__eol__5.5.1 HBase Shell简介__eol__5.5.2 General命令组__eol__5.5.3 DDL命令组__eol__5.5.4 DML命令组__eol__5.5.5 查询过滤器__eol__5.6 HBase程序设计 __eol__5.6.1 HBase Java API简介__eol__5.6.2 Hbase表管理程序设计__eol__5.6.3 HBase数据操作程序设计__eol__5.6.4 HBase Filter API__eol__5.7 HBase与MapReduce融合__eol__5.7.1 HBase与MapReduce融合概述__eol__5.7.2 HBase MapReduce Java API__eol__5.7.3 HBase MapReduce程序设计__eol__5.8 HBase学生成绩分析__eol__5.8.1 任务描述__eol__5.8.2 导入原始数据到HBase__eol__5.8.3 统计学生平均成绩__eol__本章小结__eol__思考题与习题__eol__第6章 数据仓库Hive__eol__6.1 Hive基础__eol__6.1.1 Hive简介__eol__6.1.2 Hive系统架构__eol__6.1.3 Hive工作原理__eol__6.1.4 Hive数据存储模型__eol__6.1.5 Hive数据类型__eol__6.1.6 Hive数据存储格式__eol__6.2 Hive安装与配置__eol__6.2.1 安装MySQL__eol__6.2.2 Hive安装与配置过程__eol__6.3 Beeline__eol__6.3.1 Beeline简介__eol__6.3.2 Beeline基本操作__eol__6.4 Hive DDL操作__eol__6.4.1 Hive数据库管理__eol__6.4.2 Hive表管理__eol__6.4.3 视图管理__eol__6.5 Hive DML操作__eol__6.6 Hive数据查询__eol__6.6.1 Hive SELECT基本语法__eol__6.6.2 无条件查询__eol__6.6.3 有条件查询__eol__6.6.4 查询统计__eol__6.6.5 分组查询__eol__6.6.6 子查询__eol__6.6.7 连接查询__eol__6.6.8 排序__eol__6.6.9 合并操作__eol__6.6.10 复合类型数据查询 __eol__6.7 Hive内置函数__eol__6.7.1 数学函数__eol__6.7.2 集合函数__eol__6.7.3 类型转换函数__eol__6.7.4 日期函数__eol__6.7.5 条件函数__eol__6.7.6 字符串函数__eol__6.7.7 内置聚合函数__eol__6.7.8 内置表生成函数__eol__6.7.9 窗口函数__eol__6.7.10 其他函数__eol__6.7.11 词频统计实例__eol__6.8 Hive高级应用__eol__6.8.1 用户自定义函数__eol__6.8.2 Hive与HBase整合 __eol__6.9 Hive程序设计__eol__本章小结__eol__思考题与习题__eol__第7章 数据迁移工具Sqoop__eol__7.1 Sqoop概述__eol__7.2 Sqoop安装与配置__eol__7.3 Sqoop常用命令__eol__7.4 Sqoop数据导入__eol__7.4.1 Sqoop命令参数__eol__7.4.2 数据从MySQL导入HDFS__eol__7.4.3 数据从MySQL导入Hive __eol__7.4.4 数据从MySQL导入HBase__eol__7.5 Sqoop数据导出__eol__7.5.1 Sqoop export命令参数__eol__7.5.2 从HDFS导出数据到MySQL__eol__7.5.3 从