注册 登录 进入教材巡展
#

出版时间:2022-02

出版社:中国水利水电出版社

以下为《Spark大数据处理技术》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 中国水利水电出版社
  • 9787522604855
  • 1版
  • 439678
  • 48254875-7
  • 平装
  • 16开
  • 2022-02
  • 418
  • 268
  • 工学
  • 计算机科学与技术
  • 计算机
  • 本科
作者简介
刘仁山,呼伦贝尔学院计算机学院教授。主要论文有:(1)刘仁山,孟祥宏. 含自适应阈值的ARMA的网络流量异常检测算法[J]. 信阳师范学院学报(自然版),2013,26(2):296-300.中文核心;(2)刘仁山,孟祥宏. 基于PKI的身份认证系统的设计与实现[J]. 制造业自动化,2013,35(3):113-116.中文核心等。
查看全部
内容简介
本书面向大数据技术专业,遵循知识性、实用性、系统性、条理性、连贯性和先进性的原则,力求激发读者的兴趣,注重实践性环节教学,注重各知识点之间的衔接,精心组织内容,做到由浅入深、突出重点。
本章共 9 章,第 1 章为 Spark 基础,主要包括 Spark 基础知识、Spark 应用场景以及 Spark 生态系统等内容;第 2 章为 Scala 语言基础和面向对象编程,包括 Scala 编程基础、Scala 数组和集合以及映射、Scala 对象和多继承等内容;第 3 章为 Spark 设计与运行原理,包括 Spark 架构、Spark Core 组成、Spark编程模型和计算模型等内容;第4章为Spark环境搭建和使用,包括Spark系列软件环境配置(JDK、Hadoop、MySQL-Server、Hive、ZooKeeper 、Scala、Kafka、Spark)和 Spark-shell 交互式命令工具使用等内容;第 5 章为 Spark RDD 弹性分布式数据集,包括 RDD 创建方式、RDD 转换算子和行动算子操作方法等内容;第 6 章为 Spark SQL 结构化数据处理引擎,包括 DataFrame 和 DataSet 的创建和操作以及利用 Spark SQL 操作 MySQL 数据源等内容;第 7 章为 Spark Streaming 实时流处理引擎,包括Spark Streaming 程序开发、DStream 高级数据源使用和数据转换操作等内容;第 8 章为 Spark MLlib 机器学习,包括机器学习基础、Spark MLlib 机器学习库和常用算法等内容;第 9 章为订单交易监控系统,主要完成订单交易实时监控平台的搭建,通过综合案例全面应用了 Spark 大数据处理技术中几乎所有知识点,帮助读者学习使用 Spark 进行大数据技术开发和应用。
本书可作为本专科或高职院校学生大数据技术课程教材,也可供大数据技术爱好者或其他对大数据技术感兴趣的人员学习。
本书配有电子课件,读者可以从中国水利水电出版社网站(www.waterpub.com.cn)或万水书苑网站(www.wsbookshow.com)免费下载。
Baidu
map