Hadoop大数据技术项目化教程
¥68.80定价
作者: 石慧
出版时间:2023-09
出版社:电子工业出版社
- 电子工业出版社
- 9787121447952
- 1-4
- 465974
- 66254923-7
- 平塑
- 16开
- 2023-09
- 615
- 384
- 程序设计
- 高职
内容简介
本书作为 Hadoop 大数据技术的项目化实战教材,以任务驱动为导向,深入浅出地介绍了 Hadoop 及其周边框架的应用,涵盖了当前 Hadoop 生态系统中的主流大数据技术。全书共 12 个项目,包括云计算和大数据基础概论、CentOS 的安装与网络配置、MPI 集群部署及应用、Hadoop 集群部署及应用、MapReduce 基本原理及应用、HBase 数据库的搭建及使用、Hive 数据仓库的安装及应用、Pig 数据分析、Sqoop 数据迁移、Flume 日志收集系统、Spark 部署及数据分析、大数据技术编程实例。本书秉承“实践为主、理论够用、注重实用”原则,在任务实施中融入各个知识点与课程教学内容,以便读者能更好地学习和掌握大数据关键技术。__eol__本书既可以作为高职高专院校和应用型本科院校计算机相关专业的教材,还可以作为 IT 类培训机构培训云计算和大数据技术等相关课程的实训教材,并可以作为相关技术人员的参考书。
目录
项目 1? 云计算和大数据基础概论 …………………………………………………………… 1__eol__任务 1 认识云计算 ……………………………………………………………………… 1__eol__任务 2 云计算中的虚拟化技术 ………………………………………………………… 7__eol__任务 3 云计算与大数据 …………………………………………………………………13__eol__任务 4 大数据的技术架构 ………………………………………………………………16__eol__任务 5 大数据的应用前景 ………………………………………………………………18__eol__任务 6 大数据的发展历程及其面临的挑战 ……………………………………………22__eol__项目 2? CentOS 的安装与网络配置 ……………………………………………………… 27__eol__任务 1 Linux 操作系统概述 ……………………………………………………………27__eol__任务 2 使用 VMware 虚拟机安装 CentOS ……………………………………………32__eol__任务 3 CentOS 网络环境配置 …………………………………………………………54__eol__任务 4 yum 源设置及使用 ………………………………………………………………62__eol__项目 3? MPI 集群部署及应用 ……………………………………………………………… 72__eol__任务 1 NTP 时间同步设置 ……………………………………………………………72__eol__任务 2 SSH 证书登录……………………………………………………………………78__eol__任务 3 使用 NFS 设置共享目录 ………………………………………………………82__eol__任务 4 MPI 的安装及测试 ………………………………………………………………86__eol__任务 5 MPI 编程实战 ……………………………………………………………………91__eol__项目 4? Hadoop 集群部署及应用 ………………………………………………………… 100__eol__任务 1 Hadoop 集群部署前的准备工作 …………………………………………… 100__eol__任务 2 Hadoop 的安装 ……………………………………………………………… 106__eol__任务 3 Hadoop 伪分布式部署及应用 ……………………………………………… 110__eol__任务 4 Hadoop 分布式部署及应用 ………………………………………………… 114__eol__项目 5? MapReduce 基本原理及应用 …………………………………………………… 122__eol__任务 1 MapReduce 工作原理及工作流程 …………………………………………… 122__eol__任务 2 词频统计编程实践 …………………………………………………………… 125__eol__任务 3 数据合并去重编程实践 ……………………………………………………… 136__eol__任务 4 数据排序编程实践 …………………………………………………………… 140__eol__项目 6? HBase 数据库的搭建及使用 …………………………………………………… 146__eol__任务 1 HBase 安装及伪分布式部署 ………………………………………………… 146__eol__任务 2 HBase 完全分布式部署 ……………………………………………………… 150__eol__任务 3 HBase 操作实践 ……………………………………………………………… 156__eol__任务 4 HBase 编程实践 ……………………………………………………………… 163__eol__项目 7? Hive 数据仓库的安装及应用 …………………………………………………… 175__eol__任务 1 Hive 基本概念………………………………………………………………… 175__eol__任务 2 Hive 安装及部署……………………………………………………………… 178__eol__任务 3 Hive 基本命令和应用………………………………………………………… 190__eol__项目 8? Pig 数据分析 ……………………………………………………………………… 208__eol__任务 1 Pig 基本概念 ………………………………………………………………… 208__eol__任务 2 Pig 安装及部署 ……………………………………………………………… 211__eol__任务 3 Pig 命令语法和使用 ………………………………………………………… 216__eol__任务 4 Pig 简单编程 ………………………………………………………………… 235__eol__项目 9? Sqoop 数据迁移…………………………………………………………………… 244__eol__任务 1 Sqoop 基本概念 ……………………………………………………………… 244__eol__任务 2 Sqoop 安装及部署 …………………………………………………………… 247__eol__任 务 3 利 用 Sqoop 工具实现 MySQL 与__eol__HDFS 之间数据迁移 …………………………………………………………………… 254__eol__任务 4 利用 Sqoop 工具实现 MySQL 与 Hive/HBase 之间数据迁移……………… 265__eol__项目 10? Flume 日志收集系统 …………………………………………………………… 278__eol__任务 1 Flume 系统概述 ……………………………………………………………… 278__eol__任务 2 Flume 安装和部署 …………………………………………………………… 282__eol__任务 3 Flume 应用案例 ……………………………………………………………… 291__eol__项目 11? Spark 部署及数据分析 ………………………………………………………… 305__eol__任务 1 Spark 基本概念 ……………………………………………………………… 305__eol__任务 2 Spark 安装及部署 …………………………………………………………… 308__eol__任务 3 Spark 数据分析 ……………………………………………………………… 317__eol__任务 4 Spark 应用案例 ……………………………………………………………… 332__eol__项目 12? 大数据技术编程实例 …………………………………………………………… 347__eol__任务 1 能耗数据分析及处理 ………………………………………………………… 347__eol__任务 2 餐饮大数据分析及处理 ……………………………………………………… 360__eol__参考文献……………………………………………………………………………………… 371