注册 登录 进入教材巡展
#
  • #

出版时间:2018-09

出版社:中国水利水电出版社

以下为《Hive编程技术与应用》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 中国水利水电出版社
  • 9787517069140
  • 1版
  • 222963
  • 64218174-7
  • 16开
  • 2018-09
  • 160
  • 工学
  • 计算机科学与技术
  • TP311.13
  • 自动化技术、计算机技术
  • 本科
作者简介
孙帅,中关村软件园百知教育课程研发部总监,曾主持开发项目:易宝支付3代平台系统、易宝支付风控系统、GDB敏捷开发平台、精品科技期刊全文数据库和网络服务系统、国家科技图书文献中心NSTL网络服务系统、万方数据知识服务平台、的士通3G项目、凤凰网视频3G项目。
查看全部
内容简介

《Hive编程技术与应用》通过原理加案例的方式系统地讲解了Hive编程技术,使读者能够全面地了解使用Hive的开发流程。书中精心安排了Hive的原理分析、架构特点、环境搭建、HiveQL使用等内容,给出了大量的开发案例及其开发过程,使读者对Hive开发有直观的印象。
  全书共10章:前6章系统讲解Hive工作原理、特点,Hive架构,HiveQL表操作,HiveQL数据操作,HiveQL查询,Hive安装与配置,Hive自定义函数;第8~10章是综合案例部分,通过案例帮助读者掌握整个大数据项目的开发流程,包括数据清洗、数据处理、数据导入导出。本书知识结构简单明了,案例生动具体,内容设计新颖,思路清晰。
  《Hive编程技术与应用》不仅可作为普通高校大数据相关专业的教材,也可以作为想继续深入了解大数据编程的读者的参考书,还可作为各类相关培训班的培训教材。

目录
前言章 Hive介绍1.1 Hive工作原理1.2 Hive的数据类型1.3 Hive的特点1.4 本章小结第2章 Hive架构2.1 Hive用户接口2.1.1 Hive CLI2.1.2 HWI2.1.3 Thrift服务2.2 Hive元数据库2.2.1 Hive元数据表结构2.2.2 Hive元数据的三种存储模式2.3 Hive数据存储2.4 Hive文件格式2.4.1 TextFile格式2.4.2 SequenceFile格式2.4.3 RCFile格式2.4.4 ORC格式2.5 本章小结第3章 HiveQL表操作3.1 内部表3.2 外部表3.3 分区表3.3.1 静态分区3.3.2 动态分区3.4 桶表3.5 视图3.5.1 使用视图降低查询复杂度3.5.2 使用视图来限制基于条件过滤的数据3.5.3 动态分区中的视图和map类型3.6 本章小结第4章 HiveQL数据操作4.1 装载数据到表中4.2 通过查询语句向表中插入数据4.3 单个查询语句中创建并加载数据4.4 导出数据4.5 本章小结第5章 HiveQL查询5.1 SELECT…FROM语句5.1.1 使用正则表达式来指定列的5.1.2 使用列值进行计算5.1.3 算述运算符5.1.4 使用函数5.1.5 LIMIT语句5.1.6 列别名5.1.7 嵌套SELECT语句5.1.8 CASE…WHEN…THEN语句5.2 WHERE语句5.2.1 谓词操作符5.2.2 关于浮点数比较5.2.3 LIKE和RLIKE5.3 GROtJPBY语句5.4.JOIN语句5.4.1 INNER JOIN5.4.2 JOIN优化5.4.3 LEFTOUTER JOIN5.4.4 R1GHTOUTER JOIN5.4.5 FULLOUTER JOIN5.4.6 LEFT SEMI JOIN5.4.7 笛卡尔积JOIN5.4.8 mad-side JOIN5.5 ORDER BY和SOPT BY5.6 含有SOftT BY的DISTRIBIJTE BY5.7 CLUSTER BY5.8 类型转换5.9 抽样查询5.9.1 数据块抽样5.9.2 分桶表的输入裁剪5.1 0LINIONALL5.1 1本章小结第6章 Hive配置与应用6.1 Hive安装与配置6.2 Hive访问6.3 Hive基本操作6.3.1 Hive CLI命令行操作讲解6.3.2 Hive的数据类型6.3.3 Hive表的创建6.3.4 Hive数据导入6.3.5 Hive数据导出6.4 Hive数据定义6.4.1 内部表与外部表的区别6.4.2 内部表建立6.4.3 外部表建立6.4.4 表的分区与桶的建立6.4.5 删除表与修改表结构6.4.6 HiveQL简单查询语句6.4.7 WHERE语句6.5 Hive高级查询6.6 本章小结第7章Hive自定义函数7.1 LIDF7.2 UDTF7.3 UDAF7.4 Hive函数综合案例7.4.1 Row-Sequence实现列自增长7.4.2 列转行和行转列7.5 本章小结第8章Hive综合案例(一)8.1 项目背景与数据情况8.2 关键指标KPI8.3 开发步骤分析8.4 表结构设计8.5 数据清洗过程8.5.1 定期上传日志至HDFS8.5.2 编写.MapReduce程序清理日志8.5.3 定期清理日志至HDFS8.5.4 查询清洗前后的数据8.6 数据统计分析8.6.1 借助Hive进行统计8.6.2 使用HiveQL统计关键指标8.7 本章小结第9章Hive综合案例(二)9.1 项目应用场景9.2 设计与实现9.2.1 日志格式分析9.2.2 建立表9.2.3 程序设计9.2.4 编码实现9.2.5 运行并测试9.3 本章小结0章Hive综合案例(三)10.1 应用场景10.2 设计与实现10.2.1 数据处理10.2.2 使用Hive对清洗后的数据进行多维分析10.2.3 在MySQL中建立数据库10.2.4 使用sqoop把分析结果导入到MySQL中10.2.5 程序设计与实现10.2.6 运行并测试10.3 本章总结附录
Baidu
map