Python机器学习——数据建模与分析(第2版)
¥99.00定价
作者: 薛薇
出版时间:2024-06
出版社:电子工业出版社
- 电子工业出版社
- 9787121459351
- 1-2
- 466143
- 48253879-0
- 平塑勒
- 16开
- 2024-06
- 647
- 392
- 计算机科学与技术
- 本科 研究生及以上
内容简介
机器学习是一套先进、深刻且内容丰富的算法集合,已成为数据科学最主流的分析方法;Python是一款简明、高效且功能强大的开源工具,已成为数据科学最常用的计算机编程语言。它们相得益彰,构成了当今大数据技术、人工智能等前沿领域的必备知识,是数据科学人才培养的必要内容。__eol__本书采用理论与实践相结合的方式,引导读者以Python为工具,以机器学习为方法,进行数据的建模与分析。本书共13章,对机器学习的原理部分进行了深入透彻的讲解,对机器学习算法部分进行了Python实现,并给出应用实践案例。__eol__
目录
目 录__eol____eol__第1章 机器学习概述 1__eol__1.1 机器学习的发展:人工智能中的机器学习 1__eol__1.1.1 符号主义人工智能 2__eol__1.1.2 基于机器学习的人工智能 2__eol__1.2 机器学习的核心:数据和数据建模 4__eol__1.2.1 机器学习的对象:数据集 4__eol__1.2.2 机器学习的任务:数据建模 6__eol__1.3 机器学习的典型应用 11__eol__1.3.1 机器学习的典型行业应用 11__eol__1.3.2 机器学习在客户细分中的应用 12__eol__1.3.3 机器学习在客户流失分析中的应用 13__eol__1.3.4 机器学习在营销响应分析中的应用 14__eol__1.3.5 机器学习在交叉销售中的应用 15__eol__1.3.6 机器学习在欺诈甄别中的应用 16__eol__本章总结 16__eol__本章习题 16__eol__第2章 Python机器学习基础 17__eol__2.1 Python:机器学习的首选工具 17__eol__2.2 Python的集成开发环境:Anaconda 18__eol__2.2.1 Anaconda的简介 19__eol__2.2.2 Anaconda Prompt的使用 19__eol__2.2.3 Spyder的使用 20__eol__2.2.4 Jupyter Notebook的使用 22__eol__2.3 Python第三方包的引用 23__eol__2.4 NumPy使用示例 23__eol__2.4.1 NumPy数组的创建和访问 24__eol__2.4.2 NumPy的计算功能 26__eol__2.5 Pandas使用示例 28__eol__2.5.1 Pandas的序列和索引 28__eol__2.5.2 Pandas的数据框 29__eol__2.5.3 Pandas的数据加工处理 30__eol__2.6 NumPy和Pandas的综合应用:空气质量监测数据的预处理和基本分析 32__eol__2.6.1 空气质量监测数据的预处理 32__eol__2.6.2 空气质量监测数据的基本分析 34__eol__2.7 Matplotlib的综合应用:空气质量监测数据的图形化展示 37__eol__2.7.1 AQI的时间序列变化特点 37__eol__2.7.2 AQI的分布特征及相关性分析 38__eol__本章总结 40__eol__本章相关函数列表 40__eol__本章习题 47__eol__第3章 数据预测与预测建模 48__eol__3.1 从线性回归模型说起 49__eol__3.1.1 线性回归模型的含义 49__eol__3.1.2 线性回归模型的几何理解 50__eol__3.1.3 线性回归模型的评价 50__eol__3.1.4 Python应用实践:PM2.5浓度预测 51__eol__3.2 认识线性分类模型 56__eol__3.2.1 线性分类模型的含义 56__eol__3.2.2 线性分类模型的几何理解 58__eol__3.2.3 线性分类模型的评价 60__eol__3.2.4 Python应用实践:空气质量等级预测 62__eol__3.3 从线性预测模型到非线性预测模型 67__eol__3.4 预测模型的参数估计 68__eol__3.4.1 损失函数与有监督学习 68__eol__3.4.2 参数搜索策略 70__eol__3.5 预测模型的选择 72__eol__3.5.1 泛化误差的估计 72__eol__3.5.2 Python模拟和启示:理解泛化误差 75__eol__3.5.3 预测模型过拟合问题 78__eol__3.5.4 模型选择:偏差和方差 79__eol__本章总结 82__eol__本章相关函数列表 83__eol__本章习题 83__eol__第4章 数据预测建模:贝叶斯分类器 84__eol__4.1 贝叶斯概率和贝叶斯法则 84__eol__4.1.1 贝叶斯概率 84__eol__4.1.2 贝叶斯法则 85__eol__4.2 朴素贝叶斯分类器 85__eol__4.2.1 从顾客行为分析角度看朴素贝叶斯分类器 85__eol__4.2.2 Python模拟和启示:认识朴素贝叶斯分类器的分类边界 88__eol__4.2.3 Python应用实践:空气质量等级预测 91__eol__4.3 朴素贝叶斯分类器在文本分类中的应用 93__eol__4.3.1 Python文本数据预处理:文本分词和量化计算 94__eol__4.3.2 Python文本描述性分析:词云图和文本相似性 97__eol__4.3.3 Python文本分析综合应用:裁判文书的要素提取 99__eol__4.4 贝叶斯参数估计简介* 102__eol__4.4.1 从科比投篮分析角度看贝叶斯参数估计的基本思想 102__eol__4.4.2 共轭先验分布 103__eol__4.4.3 Python应用实践:科比投篮命中率的研究 106__eol__本章总结 108__eol__本章相关函数列表 108__eol__本章习题 109__eol__第5章 数据预测建模:近邻分析 110__eol__5.1 近邻分析:K-近邻法 110__eol__5.1.1 距离:K-近邻法的近邻度量 111__eol__5.1.2 参数K:1-近邻法和K-近邻法 112__eol__5.2 回归预测中的K-近邻法 113__eol__5.2.1 Python模拟和启示:认识K-近邻回归线 113__eol__5.2.2 Python模拟和启示:认识K-近邻回归面 115__eol__5.3 分类预测中的K-近邻法 117__eol__5.3.1 基于1-近邻法和K-近邻法的分类 117__eol__5.3.2 Python模拟和启示:参数K和分类边界 118__eol__5.4 基于观测相似性的加权K-近邻法 120__eol__5.4.1 加权K-近邻法的权重 121__eol__5.4.2 Python模拟和启示:认识加权K-近邻分类边界 123__eol__5.5 K-近邻法的Python应用实践 124__eol__5.5.1 空气质量等级的预测 124__eol__5.5.2 国产电视剧大众评分的预测 126__eol__5.6 K-近邻法的适用性探讨* 127__eol__本章总结 129__eol__本章相关函数列表 130__eol__本章习题 130__eol__第6章 数据预测建模:决策树 131__eol__6.1 决策树的基本概念 131__eol__6.1.1 什么是决策树 131__eol__6.1.2 决策树的深层含义 133__eol__6.2 回归预测中的决策树 134__eol__6.2.1 决策树的回归面 134__eol__6.2.2 Python模拟和启示:树深度对回归面的影响 135__eol__6.3 分类预测中的决策树 136__eol__6.3.1 决策树的分类边界 137__eol__6.3.2 Python模拟和启示:树深度对分类边界的影响 137__eol__6.4 决策树的生长和剪枝 139__eol__6.4.1 决策树的生长 140__eol__6.4.2 决策树的剪枝 141__eol__6.5 经典决策树算法:CART 142__eol__6.5.1 CART的生长 142__eol__6.5.2 CART的后剪枝 145__eol__6.6 决策树的Python应用实践 148__eol__6.6.1 PM2.5浓度的预测 148__eol__6.6.2 空气质量等级的预测 149__eol__6.6.3 药物适用性研究 151__eol__6.7 决策树的高方差性* 153__eol__本章总结 154__eol__本章相关函数列表 154__eol__本章习题 155__eol__第7章 数据预测建模:集成学习 156__eol__7.1 集成学习概述 156__eol__7.1.1 高方差性问题的解决途径 157__eol__7.1.2 从弱模型到强模型的构建 157__eol__7.2 基于重抽样自举法的集成学习 158__eol__7.2.1 重抽样自举法 158__eol__7.2.2 袋装法的基本思想 158__eol__7.2.3 随机森林的基本思想 160__eol__7.2.4 Python应用实践:基于袋装法和随机森林预测PM2.5浓度 162__eol__7.3 从弱模型到强模型的构建:提升法 165__eol__7.3.1 提升法的基本思路 165__eol__7.3.2 Python模拟和启示:弱模型联合成为强模型 166__eol__7.3.3 分类预测中的提升法:AdaBoost.M1算法 168__eol__7.3.4 Python模拟和启示:认识AdaBoost.M1算法中高权重的样本观测 171__eol__7.3.5 回归预测中的提升法 173__eol__7.3.6 Python应用实践