统计学习(R语言版)
作者: 李高荣
出版时间:2024-09-23
出版社:高等教育出版社
- 高等教育出版社
- 9787040625189
- 1
- 529113
- 平装
- 16开
- 2024-09-23
- 880
- 556
本书介绍了统计学习的思想、方法和理论以及R语言应用,涵盖的内容包括:绪论、模型评价、线性回归模型、重抽样方法、判别分析、K近邻法、模型选择与正则化、非参数回归模型、logistic回归、决策树、支持向量机、主成分分析、聚类分析、前馈神经网络和卷积神经网络等。
本书的主要特色是提供了大量翔实的应用案例,并使用R语言进行计算和数据可视化,对书中的统计学习方法和理论都给出了R语言程序和应用,并配有相当数量的习题可供练习。
本书取材新颖、阐述严谨、推导详尽、重点突出、深入浅出、富有启发性,便于教学与自学。
本书可作为统计学、数据科学、数学、计算机科学、人工智能、金融学、经济学、医学和工程领域等专业本科生和研究生的统计学习、机器学习和数据分析等课程的教材或参考书,也可供从事数据分析的相关科技人员和工作者参考。
前辅文
第1章 绪论
§1.1 统计学习概述
1.1.1 统计学习的特点
1.1.2 统计学习的对象
1.1.3 统计学习的分类
§1.2 关于本书
§1.3 本书适用对象
习题1
第2章 模型评价
§2.1 回归模型及评价准则
2.1.1 回归模型
2.1.2 模型估计
2.1.3 回归模型精度的评价准则
§2.2 分类模型及评价准则
习题2
第3章 线性回归模型
§3.1 线性回归模型
3.1.1 模型介绍
3.1.2 最小二乘估计
3.1.3 σ2的估计
3.1.4 假设检验
3.1.5 预测区间与置信区间
3.1.6 R语言函数及应用
§3.2 回归诊断
3.2.1 什么是回归诊断?
3.2.2 残差
3.2.3 残差图
3.2.4 影响分析
3.2.5 多重共线性
§3.3 加权最小二乘方法
§3.4 Box-Cox变换
§3.5 定性协变量建模
习题3
第4章 重抽样方法
§4.1 交叉验证法
4.1.1 验证集方法
4.1.2 LOOCV方法
4.1.3 GCV方法
4.1.4 k折CV方法
§4.2 Bootstrap方法
习题4
第5章 判别分析
§5.1 判别准则
5.1.1 判别准则简介
5.1.2 两个总体的情形
§5.2 两个多元正态分布的判别
5.2.1 当Σ1=Σ2=Σ时, 正态总体的判别
5.2.2 Fisher判别
5.2.3 当Σ1≠Σ2, 正态总体的判别
5.2.4 先验概率不存在的情形
5.2.5 分类效果的评价
5.2.6 案例及R语言计算
§5.3 多个总体的判别
5.3.1 多个总体的判别方法
5.3.2 多个多元正态分布的判别方法
5.3.3 多个总体的Fisher判别方法
5.3.4 多个总体的案例及R语言计算
习题5
第6章 K近邻法
§6.1 KNN分类
6.1.1 KNN分类算法
6.1.2 K值的选择和KNN分类应用
§6.2 KNN回归
6.2.1 KNN回归算法
6.2.2 KNN回归应用
§6.3 K近邻法的优缺点
习题6
第7章 模型选择与正则化
§7.1 子集选择
7.1.1 最优子集选择
7.1.2 逐步选择方法
7.1.3 调整的判定系数R2
7.1.4 Cp准则
7.1.5 信息准则
7.1.6 案例与R语言计算
§7.2 岭回归
§7.3 桥回归
§7.4 惩罚变量选择方法
7.4.1 惩罚函数
7.4.2 Lasso方法
7.4.3 SCAD方法
7.4.4 自适应Lasso
7.4.5 弹性网方法
7.4.6 案例分析与模拟研究
习题7
第8章 非参数回归模型
§8.1 多项式回归
8.1.1 多项式回归拟合
8.1.2 分段多项式回归拟合
§8.2 回归样条
8.2.1 d阶回归样条
8.2.2 线性样条
8.2.3 三次样条
8.2.4 自然三次样条
8.2.5 节点个数和位置的选择
8.2.6 案例分析与应用
§8.3 光滑样条
8.3.1 光滑样条方法
8.3.2 光滑参数λ的选取
8.3.3 案例分析与应用
§8.4 局部非参数光滑方法
8.4.1 N-W核光滑方法
8.4.2 Gasser-Müller光滑方法
8.4.3 局部多项式光滑方法
8.4.4 案例分析与应用
§8.5 广义可加模型
§8.6 半参数回归模型
8.6.1 部分线性模型
8.6.2 单指标模型
8.6.3 变系数模型
习题8
第9章 Logistic回归
§9.1 多元logistic回归
9.1.1 多元logistic回归模型
9.1.2 极大似然估计
9.1.3 预测
§9.2 二分类模型的评估
§9.3 惩罚似然变量选择方法
§9.4 非参数logistic回归
§9.5 多项logistic回归
§9.6 分类方法比较
习题9
第10章 决策树
§10.1 决策树的基本原理
§10.2 回归树
10.2.1 递归二叉分裂法
10.2.2 代价复杂性剪枝
10.2.3 回归树的R案例分析
§10.3 分类树
10.3.1 信息增益
10.3.2 基尼指数
10.3.3 分类树的代价复杂性剪枝
10.3.4 分类树的R案例分析
§10.4 装袋法和随机森林
10.4.1 装袋法
10.4.2 袋外误差
10.4.3 随机森林
10.4.4 变量重要性的度量
10.4.5 偏依赖图
10.4.6 回归问题的R案例分析
10.4.7 分类问题的R案例分析
§10.5 提升法
10.5.1 自适应提升法
10.5.2 AdaBoost算法应用
10.5.3 回归问题的提升法
10.5.4 程序包gbm的应用
习题10
第11章 支持向量机
§11.1 最大间隔分类器
11.1.1 超平面
11.1.2 分割超平面
11.1.3 最大间隔分类器
§11.2 支持向量分类器
§11.3 支持向量机和核
§11.4 多分类的支持向量机
11.4.1 一类对一类的分类方法
11.4.2 一类对余类的分类方法
§11.5 惩罚支持向量机
§11.6 支持向量回归
§11.7 支持向量机的案例与R语言计算
11.7.1 SVM的模拟数据分析与R语言计算
11.7.2 SVM的二分类R案例
11.7.3 SVM的多分类R案例
11.7.4 SVR的R案例
习题11
第12章 主成分分析
§12.1 总体主成分分析
12.1.1 主成分的定义与导出
12.1.2 主成分的计算
12.1.3 基于标准化的主成分
§12.2 样本主成分分析
12.2.1 基于样本协方差矩阵S的主成分
12.2.2 标准化的样本主成分
§12.3 主成分分析方法的应用
12.3.1 主成分分析的R函数
12.3.2 中学生身体指标数据主成分分析
12.3.3 Fisher Iris数据主成分分析的可视化
12.3.4 图像压缩
12.3.5 人脸识别
§12.4 核主成分分析
习题12
第13章 聚类分析
§13.1 距离和相似系数
13.1.1 数据预处理
13.1.2 样本间的距离
13.1.3 相似系数
13.1.4 定性变量样本的距离和相似系数
13.1.5 定性变量间的相似系数
§13.2 K均值聚类
13.2.1 K均值聚类算法
13.2.2 K均值聚类中类个数的确定和应用
13.2.3 图像色彩的K均值聚类
§13.3 系统聚类法
13.3.1 类间距离和系统聚类法
13.3.2 系统聚类法的统一
13.3.3 系统聚类法的性质和类的确定
13.3.4 系统聚类的R语言计算与应用
13.3.5 新的聚类方法
习题13
第14章 前馈神经网络
§14.1 神经元模型
14.1.1 神经元
14.1.2 激活函数
§14.2 前馈神经网络模型
14.2.1 网络结构
14.2.2 前馈神经网络模型及表示
14.2.3 通用近似定理
14.2.4 应用到机器学习
§14.3 反向传播算法
14.3.1 参数学习
14.3.2 BP算法
§14.4 前馈神经网络的正则化
§14.5 R案例分析与应用
14.5.1 回归问题的R案例
14.5.2 分类问题的R案例
习题14
第15章 卷积神经网络
§15.1 卷积
15.1.1 数学卷积
15.1.2 一维卷积
15.1.3 二维卷积
15.1.4 互相关
15.1.5 填充和步长
15.1.6 三维卷积
§15.2 汇聚
15.2.1 二维汇聚
15.2.2 三维汇聚
§15.3 卷积神经网络模型
15.3.1 模型的定义
15.3.2 卷积神经网络的性质
§15.4 卷积神经网络的学习算法
15.4.1 卷积导数
15.4.2 反向传播算法
§15.5 R案例分析与应用
15.5.1 二分类的R案例分析
15.5.2 多分类的R案例分析
习题15
参考文献
索引