数据挖掘算法原理与实现 / 计算机系列教材
¥29.00定价
作者: 王振武,徐慧
出版时间:2015-01
出版社:清华大学出版社
- 清华大学出版社
- 9787302376415
- 1-1
- 100309
- 16开
- 2015-01
- 工学
- 软件工程
- TP311.13
- 计算机
内容简介
本书对数据挖掘的基本算法进行了系统的介绍,每种算法不仅包括对算法基本原理的介绍,而且配有大量的例题以及源代码,并且对源代码进行了分析,这种理论和实践相结合的方式有助于读者较好地理解和掌握抽象的数据挖掘算法。 全书共分11章,内容同时涵盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法,具体章节包括绪论、数据预处理、关联规则挖掘、决策树分类算法、贝叶斯分类算法、人工神经网络算法、支持向量机、K�瞞eans聚类算法、K�仓行牡憔劾嗨惴ā⑸窬�网络聚类算法以及数据挖掘的发展等内容。 本书可作为高等院校数据挖掘课程的教材,也可以作为从事数据挖掘工作以及其他相关工程技术工作的人员的参考书。
目录
第1章 绪论
1.1 数据挖掘的概念
1.2 数据挖掘的历史及发展
1.3 数据挖掘的研究内容及功能
1.3.1 数据挖掘的研究内容
1.3.2 数据挖掘的功能
1.4 数据挖掘的常用技术及工具
1.4.1 数据挖掘的常用技术
1.4.2 数据挖掘的工具
1.5 数据挖掘的应用热点
1.6 小结
思考题
第2章 数据预处理
2.1 数据预处理的目的
2.2 数据清理
2.2.1 填充缺失值
2.2.2 光滑噪声数据
2.2.3 数据清理过程
2.3 数据集成和数据变换
2.3.1 数据集成
2.3.2 数据变换
2.4 数据规约
2.4.1 数据立方体聚集
2.4.2 维规约
2.4.3 数据压缩
2.4.4 数值归约
2.4.5 数据离散化与概念分层
2.5 特征选择与提取
2.5.1 特征选择
2.5.2 特征提取
2.6 小结
思考题
第3章 关联规则挖掘
3.1 基本概念
3.2 关联规则挖掘算法——Apriori算法原理
3.3 Apriori算法实例分析
3.4 Apriori算法源程序分析
3.5 Apriori算法的特点及应用
3.5.1 Apriori算法特点
3.5.2 Apriori算法应用
3.6 小结
思考题
第4章 决策树分类算法
4.1 基本概念
4.1.1 决策树分类算法概述
4.1.2 决策树基本算法概述
4.2 决策树分类算法——ID3算法原理
4.2.1 ID3算法原理
4.2.2 熵和信息增益
4.2.3 ID3算法
4.3 ID3算法实例分析
4.4 ID3算法源程序分析
4.5 ID3算法的特点及应用
4.5.1 ID3算法特点
4.5.2 ID3算法应用
4.6 决策树分类算法——C4.5算法原理
4.6.1 C4.5算法
4.6.2 C4.5算法的伪代码
4.7 C4.5算法实例分析
4.8 C4.5算法源程序分析
4.9 C4.5算法的特点及应用
4.9.1 C4.5算法特点
4.9.2 C4.5算法应用
4.10 小结
思考题
第5章 贝叶斯分类算法
5.1 基本概念
5.1.1 主观概率
5.1.2 贝叶斯定理
5.2 贝叶斯分类算法原理
5.2.1 朴素贝叶斯分类模型
5.2.2 贝叶斯信念网络
5.3 贝叶斯算法实例分析
5.3.1 朴素贝叶斯分类器
5.3
5.4 贝叶斯算法源程序分析
5.5 贝叶斯算法特点及应用
5.5.1 朴素贝叶斯分类算法
5.5.2 贝叶斯信念网
思考题
第6章 人工神经网络算法
6.1 基本概念
6.1.1 生物神经元模型
6.1.2 人工神经元模型
6.1.3 主要的神经网络模型
6.2 BP算法原理
6.2.1 Delta学习规则的基本原理
6.2.2 BP网络的结构
6.2.3 BP网络的算法描述
6.2.4 标准BP网络的工作过程
6.3 BP算法实例分析
6.4 BP算法源程序分析
6.5 BP算法的特点及应用
6.5.1 BP算法特点
6.5.2 BP算法应用
6.6 小结
思考题
第7章 支持向量机
7.1 基本概念
7.1.1 支持向量机理论基础
7.1.2 统计学习核心理论
7.1.3 学习过程的一致性条件
7.1.4 函数集的VC维
7.1.5 泛化误差界
7.1.6 结构风险最小化归纳原理
7.2 支持向量机原理
7.2.1 支持向量机核心理论
7.2.2 最大间隔分类超平面
7.2.3 支持向量机
7.2.4 核函数分类
7.3 支持向量机实例分析
7.4 支持向量机的特点及应用
7.4.1 支持向量机的特点
7.4.2 支持向量机的应用
7.5 小结
思考题
第8章 K-means聚类算法
8.1 简介
8.2 K-means聚类算法原理
8.3 K-means聚类算法实例分析
8.4 K-means聚类算法源程序分析
8.5 K-means聚类算法的特点及应用
8.5.1 K-means聚类算法的特点
8.5.2 K-means聚类算法的应用
8.6 小结
思考题
第9章 K-中心点聚类算法
9.1 简介
9.2 K-中心点聚类算法原理
9.3 K-中心点聚类算法实例分析
9.4 K-中心点聚类算法源程序分析
9.5 K-中心点聚类算法的特点及应用
9.5.1 K-中心点聚类算法的特点
9.5.2 K-中心点聚类算法的应用
9.6 小结
第10章 神经网络聚类方法:SOM
10.1 简介
10.2 竞争学习算法基础
10.2.1 自组织神经网络结构
10.2.2 自组织神经网络的原理
10.3 SOM算法原理
10.3.1 SOM网络的拓扑结构
10.3.2 SOM权值调整域
10.3.3 SOM网络运行原理
10.3.4 学习方法
10.4 SOM算法实例分析
10.4.1 问题描述
10.4.2 网络设计及学习结果
10.4.3 结果输出
10.5 SOM算法源程序分析
10.6 SOM算法的特点及应用
10.6.1 SOM特点
10.6.2 SOM应用
10.7 小结
思考题
第11章 数据挖掘的发展
11.1 Web挖掘
11.1.1 Web数据挖掘定义
11.1.2 Web数据挖掘分类
11.1.3 Web数据挖掘的数据源
11.1.4 Web数据挖掘中知识的分类
11.1.5 Web数据挖掘的关键问题
11.2 空间数据挖掘
11.2.1 空间数据挖掘的定义与特点
11.2.2 空间数据挖掘的体系结构
11.2.3 空间数据挖掘可获得的知识类型
11.2.4 空间数据挖掘的方法
11.3 流数据挖掘
11.3.1 流数据的特点
11.3.2 流数据挖掘关键技术
11.3.3 流数据挖掘的实际应用及前景
11.4 数据挖掘与可视化技术
11.4.1 什么是可视化
11.4.2 数据可视化技术分类
11.4.3 数据挖掘可视化技术的应用
11.5 小结
思考题
参考文献
1.1 数据挖掘的概念
1.2 数据挖掘的历史及发展
1.3 数据挖掘的研究内容及功能
1.3.1 数据挖掘的研究内容
1.3.2 数据挖掘的功能
1.4 数据挖掘的常用技术及工具
1.4.1 数据挖掘的常用技术
1.4.2 数据挖掘的工具
1.5 数据挖掘的应用热点
1.6 小结
思考题
第2章 数据预处理
2.1 数据预处理的目的
2.2 数据清理
2.2.1 填充缺失值
2.2.2 光滑噪声数据
2.2.3 数据清理过程
2.3 数据集成和数据变换
2.3.1 数据集成
2.3.2 数据变换
2.4 数据规约
2.4.1 数据立方体聚集
2.4.2 维规约
2.4.3 数据压缩
2.4.4 数值归约
2.4.5 数据离散化与概念分层
2.5 特征选择与提取
2.5.1 特征选择
2.5.2 特征提取
2.6 小结
思考题
第3章 关联规则挖掘
3.1 基本概念
3.2 关联规则挖掘算法——Apriori算法原理
3.3 Apriori算法实例分析
3.4 Apriori算法源程序分析
3.5 Apriori算法的特点及应用
3.5.1 Apriori算法特点
3.5.2 Apriori算法应用
3.6 小结
思考题
第4章 决策树分类算法
4.1 基本概念
4.1.1 决策树分类算法概述
4.1.2 决策树基本算法概述
4.2 决策树分类算法——ID3算法原理
4.2.1 ID3算法原理
4.2.2 熵和信息增益
4.2.3 ID3算法
4.3 ID3算法实例分析
4.4 ID3算法源程序分析
4.5 ID3算法的特点及应用
4.5.1 ID3算法特点
4.5.2 ID3算法应用
4.6 决策树分类算法——C4.5算法原理
4.6.1 C4.5算法
4.6.2 C4.5算法的伪代码
4.7 C4.5算法实例分析
4.8 C4.5算法源程序分析
4.9 C4.5算法的特点及应用
4.9.1 C4.5算法特点
4.9.2 C4.5算法应用
4.10 小结
思考题
第5章 贝叶斯分类算法
5.1 基本概念
5.1.1 主观概率
5.1.2 贝叶斯定理
5.2 贝叶斯分类算法原理
5.2.1 朴素贝叶斯分类模型
5.2.2 贝叶斯信念网络
5.3 贝叶斯算法实例分析
5.3.1 朴素贝叶斯分类器
5.3
5.4 贝叶斯算法源程序分析
5.5 贝叶斯算法特点及应用
5.5.1 朴素贝叶斯分类算法
5.5.2 贝叶斯信念网
思考题
第6章 人工神经网络算法
6.1 基本概念
6.1.1 生物神经元模型
6.1.2 人工神经元模型
6.1.3 主要的神经网络模型
6.2 BP算法原理
6.2.1 Delta学习规则的基本原理
6.2.2 BP网络的结构
6.2.3 BP网络的算法描述
6.2.4 标准BP网络的工作过程
6.3 BP算法实例分析
6.4 BP算法源程序分析
6.5 BP算法的特点及应用
6.5.1 BP算法特点
6.5.2 BP算法应用
6.6 小结
思考题
第7章 支持向量机
7.1 基本概念
7.1.1 支持向量机理论基础
7.1.2 统计学习核心理论
7.1.3 学习过程的一致性条件
7.1.4 函数集的VC维
7.1.5 泛化误差界
7.1.6 结构风险最小化归纳原理
7.2 支持向量机原理
7.2.1 支持向量机核心理论
7.2.2 最大间隔分类超平面
7.2.3 支持向量机
7.2.4 核函数分类
7.3 支持向量机实例分析
7.4 支持向量机的特点及应用
7.4.1 支持向量机的特点
7.4.2 支持向量机的应用
7.5 小结
思考题
第8章 K-means聚类算法
8.1 简介
8.2 K-means聚类算法原理
8.3 K-means聚类算法实例分析
8.4 K-means聚类算法源程序分析
8.5 K-means聚类算法的特点及应用
8.5.1 K-means聚类算法的特点
8.5.2 K-means聚类算法的应用
8.6 小结
思考题
第9章 K-中心点聚类算法
9.1 简介
9.2 K-中心点聚类算法原理
9.3 K-中心点聚类算法实例分析
9.4 K-中心点聚类算法源程序分析
9.5 K-中心点聚类算法的特点及应用
9.5.1 K-中心点聚类算法的特点
9.5.2 K-中心点聚类算法的应用
9.6 小结
第10章 神经网络聚类方法:SOM
10.1 简介
10.2 竞争学习算法基础
10.2.1 自组织神经网络结构
10.2.2 自组织神经网络的原理
10.3 SOM算法原理
10.3.1 SOM网络的拓扑结构
10.3.2 SOM权值调整域
10.3.3 SOM网络运行原理
10.3.4 学习方法
10.4 SOM算法实例分析
10.4.1 问题描述
10.4.2 网络设计及学习结果
10.4.3 结果输出
10.5 SOM算法源程序分析
10.6 SOM算法的特点及应用
10.6.1 SOM特点
10.6.2 SOM应用
10.7 小结
思考题
第11章 数据挖掘的发展
11.1 Web挖掘
11.1.1 Web数据挖掘定义
11.1.2 Web数据挖掘分类
11.1.3 Web数据挖掘的数据源
11.1.4 Web数据挖掘中知识的分类
11.1.5 Web数据挖掘的关键问题
11.2 空间数据挖掘
11.2.1 空间数据挖掘的定义与特点
11.2.2 空间数据挖掘的体系结构
11.2.3 空间数据挖掘可获得的知识类型
11.2.4 空间数据挖掘的方法
11.3 流数据挖掘
11.3.1 流数据的特点
11.3.2 流数据挖掘关键技术
11.3.3 流数据挖掘的实际应用及前景
11.4 数据挖掘与可视化技术
11.4.1 什么是可视化
11.4.2 数据可视化技术分类
11.4.3 数据挖掘可视化技术的应用
11.5 小结
思考题
参考文献