大数据挖掘实验教程 / 高等职业教育新工科系列教材·计算机专业系列
¥49.80定价
作者: 赵志升,梁俊花
出版时间:2020
出版社:北京师范大学出版社
- 北京师范大学出版社
- 9787303260997
- 1-1
- 365410
- 67227931-2
- 16开
- 2020
- 320
- 工学
- 计算机科学与技术
- 专业基础课
- 高职
作者简介
目录
第1章实验工具的选择1
11实验工具选择1
12R语言3
13Python语言15
第2章数据的准备34
21数据采集34
22数据抽样51
23数据质量分析55
第3章数据预处理方法77
31数据清洗77
32数据集成85
33数据变换90
34数据规约97
35数据降维106
第4章回归方法110
41多元线性回归110
42逻辑回归120
43线性判别分析126
第5章分类方法131
51K近邻分类131
52贝叶斯分类139
53神经网络146
54决策树153
55随机森林160
56支持向量机164
57分类的评价175
第6章关联规则192
61关联规则概要192
62Apriori算法193
63FPGrowth算法200
第7章聚类分析207
71聚类方法概要207
72Kmeans聚类算法209
73K中心点聚类算法216
74密度聚类算法220
75层次聚类算法225
76期望最大化聚类算法228
77神经网络聚类算法232
78模糊C均值聚类算法235
79高斯混合聚类算法238
第8章预测方法241
81预测方法概要241
82灰色预测241
83马尔科夫预测247
第9章离群点诊断251
91单变量的离群点诊断251
92基于回归的离群点诊断254
93基于聚类的离群点诊断259
94局部离群点因子检测263
第10章时间序列分析方法267
101季节指数预测法267
102解读自回归时间序列模型272
103时间序列分解280
第11章综合案例286
111员工离职预测分析286
112北京二手房房价分析299
11实验工具选择1
12R语言3
13Python语言15
第2章数据的准备34
21数据采集34
22数据抽样51
23数据质量分析55
第3章数据预处理方法77
31数据清洗77
32数据集成85
33数据变换90
34数据规约97
35数据降维106
第4章回归方法110
41多元线性回归110
42逻辑回归120
43线性判别分析126
第5章分类方法131
51K近邻分类131
52贝叶斯分类139
53神经网络146
54决策树153
55随机森林160
56支持向量机164
57分类的评价175
第6章关联规则192
61关联规则概要192
62Apriori算法193
63FPGrowth算法200
第7章聚类分析207
71聚类方法概要207
72Kmeans聚类算法209
73K中心点聚类算法216
74密度聚类算法220
75层次聚类算法225
76期望最大化聚类算法228
77神经网络聚类算法232
78模糊C均值聚类算法235
79高斯混合聚类算法238
第8章预测方法241
81预测方法概要241
82灰色预测241
83马尔科夫预测247
第9章离群点诊断251
91单变量的离群点诊断251
92基于回归的离群点诊断254
93基于聚类的离群点诊断259
94局部离群点因子检测263
第10章时间序列分析方法267
101季节指数预测法267
102解读自回归时间序列模型272
103时间序列分解280
第11章综合案例286
111员工离职预测分析286
112北京二手房房价分析299