注册 登录 进入教材巡展
#
  • #
  • #

出版时间:2020-08

出版社:高等教育出版社

“十二五”普通高等教育本科国家级规划教材

以下为《数据仓库与数据分析教程(第2版)》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 高等教育出版社
  • 9787040548518
  • 2版
  • 357376
  • 44259726-6
  • 平装
  • 特殊
  • 2020-08
  • 450
  • 250
  • 工学
  • 软件工程
  • 计算机科学与技术
  • 本科 研究生及以上
内容简介

数据仓库和数据分析技术是信息领域的核心技术之一,是基于海量数据的决策支持系统体系化环境的核心。

本书详尽地介绍了数据仓库与数据分析技术的基本概念和基本原理、建立数据仓库和进行数据分析的方法及过程。全书分为数据仓库技术篇、联机分析处理技术篇、数据挖掘技术篇、大数据技术篇4部分,共12章。

本书可作为高校计算机、信息管理类专业本科生和研究生的教材,也可供企事业单位信息管理部门及行业应用人员参考使用。

目录

 前辅文
 第1篇 数据仓库技术
  第1章 从数据库到数据仓库
   1.1 数据仓库产生的原因
    1.1.1 操作型数据处理
    1.1.2 分析型数据处理
    1.1.3 两种数据处理模式的差别
    1.1.4 数据库系统的局限性
   1.2 数据仓库的基本概念
    1.2.1 主题与面向主题
    1.2.2 数据仓库数据的其他3个特征
    1.2.3 数据仓库的功能
   1.3 数据仓库的体系结构
    1.3.1 体系结构
    1.3.2 数据集市
   小结
   习题1
  第2章 操作型数据存储
   2.1 什么是ODS
    2.1.1 ODS的定义及特点
    2.1.2 ODS的功能和实现机制
   2.2 DB~ODS~DW体系结构
    2.2.1 ODS与DW
    2.2.2 DB~ODS~DW三层体系结构
   小结
   习题2
  第3章 数据仓库中的数据及组织
   3.1 数据仓库中的数据组织
   3.2 数据仓库中数据的追加
   3.3 数据仓库中的元数据
    3.3.1 元数据的定义
    3.3.2 元数据的分类
    3.3.3 元数据管理的标准化
   小结
   习题3
 第2篇 联机分析处理技术
  第4章 概述及模型
   4.1 OLAP技术概述
   4.2 多维数据模型
    4.2.1 基本概念
    4.2.2 星形模型、雪片模型和事实群模型
   4.3 多维分析操作
    4.3.1 多维分析的基础:聚集
    4.3.2 常用的多维分析操作
    4.3.3 其他多维分析操作
    4.3.4 聚集的一些限制
    4.3.5 水平层次结构和非水平层次结构
   4.4 多维查询语言
    4.4.1 MDX简介
    4.4.2 MDX对象模型
   4.5 多维数据展示
   小结
   习题4
  第5章 数据方体的存储、预计算和缩减
   5.1 数据方体格结构
    5.1.2 数据方体格
   5.2 数据方体的存储
    5.2.1 MOLAP
    5.2.2 ROLAP
    5.2.3 MOLAP和ROLAP实现机制的比较
   5.3 数据方体的预计算
    5.3.1 预计算相关概念
    5.3.2 单表和多表
    5.3.3 完整数据方体预计算方法
    5.3.4 部分数据方体预计算方法
   5.4 数据方体缩减技术
    5.4.1 Dwarf数据方体
    5.4.2 Condensed数据方体
    5.4.3 Quotient数据方体
   小结
   习题5
  第6章 数据方体的索引、查询和维护
   6.1 数据方体的索引技术
    6.1.1 树索引
    6.1.2 位图索引
   6.2 数据方体的查询处理和优化技术
    6.2.1 子查询划分技术
    6.2.2 子查询处理及优化技术
   6.3 数据方体的维护技术
   小结
   习题6
 第3篇 数据挖掘技术
  第7章 数据挖掘概述
   7.1 数据挖掘简介
    7.1.1 数据挖掘的特点
    7.1.2 数据挖掘与KDD
    7.1.3 数据挖掘与OLAP
    7.1.4 数据挖掘与数据仓库
    7.1.5 数据挖掘的分类
    7.1.6 数据挖掘的应用
   7.2 数据挖掘算法的组件化思想
    7.2.1 模型或模式结构
    7.2.2 数据挖掘任务
    7.2.3 评分函数
    7.2.4 搜索和优化方法
    7.2.5 数据管理策略
    7.2.6 组件化思想的应用
   小结
   习题7
  第8章 频繁模式挖掘
   8.1 频繁项集和关联规则
    8.1.1 问题描述
    8.1.2 关联规则分类
    8.1.3 关联规则挖掘的经典算法Apriori
    8.1.4 关联规则挖掘的重要算法FP-Growth
    8.1.5 其他关联规则挖掘方法
    8.1.6 关联规则的兴趣度
   8.2 序列模式挖掘
    8.2.1 问题描述
    8.2.2 GSP算法
    8.2.3 PrefixSpan算法
   8.3 频繁子图挖掘
    8.3.1 问题描述
    8.3.2 基于Apriori的广度优先搜索算法
    8.3.3 基于FP-Growth的深度优先搜索算法
   小结
   习题8
  第9章 预测建模:分类和回归
   9.1 预测建模简介
    9.1.1 用于预测的模型结构
    9.1.2 用于预测的评分函数
    9.1.3 用于预测的搜索和优化策略
   9.2 决策树分类
    9.2.1 建树阶段
    9.2.2 剪枝阶段
    9.2.3 分类规则的生成
    9.2.4 可扩展性问题
    9.2.5 其他问题
   9.3 贝叶斯分类
    9.3.1 基本概念
    9.3.2 朴素贝叶斯分类
   9.4 支持向量机分类
    9.4.1 线性可分时的二元分类问题
    9.4.2 线性不可分时的二元分类问题
    9.4.3 多元分类问题
    9.4.4 可扩展性问题
   9.5 人工神经网络分类
    9.5.1 神经网络的组成
    9.5.2 神经网络分类方法
   9.6 文本分类实践案例:精准营销中搜狗用户画像挖掘
    9.6.1 分词与文本表示
    9.6.2 数据简介
    9.6.3 数据分析
   小结
   习题9
  第10章 描述建模:聚类
   10.1 聚类分析简介
    10.1.1 对象间的相似性
    10.1.2 其他相似性度量
   10.2 聚类方法概述
    10.2.1 基于划分的聚类方法
    10.2.2 基于密度的聚类方法
    10.2.3 基于层次的聚类方法
    10.2.4 基于模型的聚类方法
    10.2.5 基于方格的聚类方法
   10.3 文本聚类的典型应用:话题检测
    10.3.1 识别单个话题
    10.3.2 PLSA方法
    10.3.3 改进的PLSA方法
    10.3.4 LDA方法
   10.4 实践案例:用LDA实现话题检测
    10.4.1 背景及数据
    10.4.2 数据预处理
    10.4.3 话题检测
   小结
   习题10
  第11章 推荐系统
   11.1 概述
    11.1.1 推荐系统与网络大数据
    11.1.2 推荐系统的产生与发展
    11.1.3 推荐系统的本质
   11.2 推荐系统的系统架构
    11.2.1 用户建模
    11.2.2 推荐引擎
   11.3 典型推荐算法介绍
    11.3.1 基于内容的推荐算法
    11.3.2 基于协同过滤的推荐算法
    11.3.3 基于上下文的推荐算法
    11.3.4 层次化上下文推荐算法
   11.4 大数据环境下的推荐系统
    11.4.1 特点与挑战
    11.4.2 关键技术
   11.5 开源大数据典型推荐软件
   11.6 大数据推荐系统研究面临的问题
   小结
   习题11
 第4篇 大数据技术
  第12章 大数据技术概述
   12.1 大数据处理与分析的理论与技术
   12.2 大数据的特征
   12.3 大数据与数据仓库
   12.4 大数据时代的数据仓库Hive
    12.4.1 Hive的工作组件
    12.4.2 Hive的工作流程
    12.4.3 Hive的数据模型
    12.4.4 Hive的工作机制
   12.5 大数据分析
    12.5.1 大数据分析的挑战
    12.5.2 深度学习模型简介
   小结
   习题12
  参考文献

Baidu
map