Hadoop大数据技术与应用
¥56.50定价
作者: 方曙东
出版时间:2020-01
出版社:浙江科学技术出版社
- 浙江科学技术出版社
- 9787534188947
- 281259
- 2020-01
内容简介
《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》作为Hadoop的入门教材,采用理论与实践相结合的方式,全面介绍了Hadoop大数据技术。它将帮助您:
·使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集进行分布式计算。
·使用Hadoop YARN资源管理器统一管理和调度Hadoop资源。
·熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理。
·洞悉编写MapReduce实际应用时的常见陷阱和高级特性。
·设计、构建和管理一个专用的Hadoop集群或在云上运行Hadoop。
·使用高级查询语言Pig来处理大规模数据。
·利用Hadoop数据库HBase来保存和处理结构化/半结构化数据。
·利用HIVE数据仓库工具对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。
·利用SqoopSqoop在关系数据库以及Hadoop数据存储和处理平台进行数据导入、导出。
·学会利用ZooKeeper来构建分布式系统。
·学会利用Ambari来构建、管理、监控Hadoop生态的集群。
《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》直接将相关行业典型案例作为实验教学内容编入,展示了如何用Hadoop解决实际行业场景中的问题,对实际操作更有针对性。《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》可作为高等院校数据科学与大数据技术、计算机、信息管理等相关专业的大数据入门教材。
·使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集进行分布式计算。
·使用Hadoop YARN资源管理器统一管理和调度Hadoop资源。
·熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理。
·洞悉编写MapReduce实际应用时的常见陷阱和高级特性。
·设计、构建和管理一个专用的Hadoop集群或在云上运行Hadoop。
·使用高级查询语言Pig来处理大规模数据。
·利用Hadoop数据库HBase来保存和处理结构化/半结构化数据。
·利用HIVE数据仓库工具对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。
·利用SqoopSqoop在关系数据库以及Hadoop数据存储和处理平台进行数据导入、导出。
·学会利用ZooKeeper来构建分布式系统。
·学会利用Ambari来构建、管理、监控Hadoop生态的集群。
《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》直接将相关行业典型案例作为实验教学内容编入,展示了如何用Hadoop解决实际行业场景中的问题,对实际操作更有针对性。《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》可作为高等院校数据科学与大数据技术、计算机、信息管理等相关专业的大数据入门教材。
目录
第1章 初识Hadoop大数据技术
1.1 大数据技术概述
1.2 Google的“三驾马车
1.3 Hadoop概述
1.4 Hadoop生态圈
1.5 Hadoop的典型应用场景与应用架构
第2章 Hadoop环境设置
2.1 安装前准备
2.2 Hadoop的安装
实验1 搭建Hadoop伪分布式模式环境
第3章 HDFS
3.1 HDFS简介
3.2 HDFS的组成与架构
3.3 HDFS的工作机制
3.4 HDFS操作
3.5 HDFS的高级功能
实验2 通过Shall命令访问HDFS
实验3 熟悉基于IDEA+Maven的Java开发环境
实验4 通过API访问HDFS
第4章 YARN
4.1 YARN产生的背景
4.2 初识YARN
4.3 YARN的架构
4.4 YARN的调度器
第5章 MapReduce
5.1 MapReduce概述
5.2 MapReduce编程模型
5.3 MapReduce编程进阶
5.4 MapReduce的工作机制
5.5 MapReduce编程案例
实验5 分析和编写WordCount程序
实验6 MapReduce序列化、分区实验
实验7 使用MapReduce求出各年销售笔数、各年销售总额
实验8 使用MapReduce统计用户在搜狗_k_gs搜索数据
第6章 HBase、Hive、Pig
6.1 HBase
6.2 Hive
6.3 Pig
实验9 HBase实验——安装和配置(可选)
实验10 HBase实验——通过ItBase Shell访问HBase(可选)
实验11 HBase实验——通过JavaAPI访问HBase
实验12 HBase实验——通过Java API开发基于HBase的MapReduce程序
实验13 Hive实验——Metastore采用Local模式(MySQL数据库)搭建Hive环境(可选)
实验14 Hive实验——Hive常用操作
实验15 Pig实验——安装和使用Pig(可选)
实验16 Pig实验——使用Pig Latin操作员工表和部门表
第7章 Flume
7.1 Flume产生的背景
7.2 Flume简介
7.3 Flume的安装
7.4 Flume的架构
7.5 Flume的应用
7.6 Flume的工作方式
实验17 Flume的配置与使用1——Avro Source+Memory Channel+Logger Sink
实验18 Flume的配置与使用2——Syslogtcp Source+Memory Channel HDFS Sink
实验19 Fhune的配置与使用3——Exec Source+Memory Channel+ Logger Sink
第8章 Sqoop
8.1 Sqoop背景简介
8.2 Sqoop的基本原理
8.3 Sqoop的安装与部署
8.4 Sqoop应用
实验20 Sqoop常用功能的使用
第9章 ZooKeeper
9.1 ZooKeeper简介
9.2 ZooKeeper的安装
9.3 ZooKeeper的基本原理
9.4 ZooKeeper的简单操作
9.5 ZooKeeper的特性
9.6 ZooKeeper的应用场景
实验21 ZooKeeper的3种访问方式
第10章 Ambari
10.1 Ambari简介
10.2 Ambari的安装
10.3 利用Ambari管理Hadoop集群
10.4 Ambari的架构和工作原理
第11章 Mahout
11.1 Mahout简介
11.2 Taste简介
11.3 使用Taste构建推荐系统
实验22 基于Mahout的电影推荐系统
实验23 搜狗日志查询分析(MapReduce+Hive综合实验)
1.1 大数据技术概述
1.2 Google的“三驾马车
1.3 Hadoop概述
1.4 Hadoop生态圈
1.5 Hadoop的典型应用场景与应用架构
第2章 Hadoop环境设置
2.1 安装前准备
2.2 Hadoop的安装
实验1 搭建Hadoop伪分布式模式环境
第3章 HDFS
3.1 HDFS简介
3.2 HDFS的组成与架构
3.3 HDFS的工作机制
3.4 HDFS操作
3.5 HDFS的高级功能
实验2 通过Shall命令访问HDFS
实验3 熟悉基于IDEA+Maven的Java开发环境
实验4 通过API访问HDFS
第4章 YARN
4.1 YARN产生的背景
4.2 初识YARN
4.3 YARN的架构
4.4 YARN的调度器
第5章 MapReduce
5.1 MapReduce概述
5.2 MapReduce编程模型
5.3 MapReduce编程进阶
5.4 MapReduce的工作机制
5.5 MapReduce编程案例
实验5 分析和编写WordCount程序
实验6 MapReduce序列化、分区实验
实验7 使用MapReduce求出各年销售笔数、各年销售总额
实验8 使用MapReduce统计用户在搜狗_k_gs搜索数据
第6章 HBase、Hive、Pig
6.1 HBase
6.2 Hive
6.3 Pig
实验9 HBase实验——安装和配置(可选)
实验10 HBase实验——通过ItBase Shell访问HBase(可选)
实验11 HBase实验——通过JavaAPI访问HBase
实验12 HBase实验——通过Java API开发基于HBase的MapReduce程序
实验13 Hive实验——Metastore采用Local模式(MySQL数据库)搭建Hive环境(可选)
实验14 Hive实验——Hive常用操作
实验15 Pig实验——安装和使用Pig(可选)
实验16 Pig实验——使用Pig Latin操作员工表和部门表
第7章 Flume
7.1 Flume产生的背景
7.2 Flume简介
7.3 Flume的安装
7.4 Flume的架构
7.5 Flume的应用
7.6 Flume的工作方式
实验17 Flume的配置与使用1——Avro Source+Memory Channel+Logger Sink
实验18 Flume的配置与使用2——Syslogtcp Source+Memory Channel HDFS Sink
实验19 Fhune的配置与使用3——Exec Source+Memory Channel+ Logger Sink
第8章 Sqoop
8.1 Sqoop背景简介
8.2 Sqoop的基本原理
8.3 Sqoop的安装与部署
8.4 Sqoop应用
实验20 Sqoop常用功能的使用
第9章 ZooKeeper
9.1 ZooKeeper简介
9.2 ZooKeeper的安装
9.3 ZooKeeper的基本原理
9.4 ZooKeeper的简单操作
9.5 ZooKeeper的特性
9.6 ZooKeeper的应用场景
实验21 ZooKeeper的3种访问方式
第10章 Ambari
10.1 Ambari简介
10.2 Ambari的安装
10.3 利用Ambari管理Hadoop集群
10.4 Ambari的架构和工作原理
第11章 Mahout
11.1 Mahout简介
11.2 Taste简介
11.3 使用Taste构建推荐系统
实验22 基于Mahout的电影推荐系统
实验23 搜狗日志查询分析(MapReduce+Hive综合实验)