大数据处理与智能决策
¥20.00定价
作者: 利节
出版时间:2020-08
出版社:西安电子科技大学出版社
- 西安电子科技大学出版社
- 9787560657189
- 1版
- 349549
- 平装
- 16开
- 2020-08
- 183
- 128
- TP274
- 自动化技术、计算技术
内容简介
本书向读者介绍大数据处理与智能决策的入门知识,其特点在于摒弃了智能算法繁琐枯燥的数学推导,聚焦于知识的理解与实践,以培养读者的项目开发能力与工程实践能力为目标。本书的主要内容包括线性回归算法、聚类算法、分类算法的概况和典型算法的分析与实现,以及TensorFlow在大数据处理与智能决策中的经典应用。
本书介绍的算法和工具都需要动手实践才能更好地理解,因此在每种算法详解后都附有当前最常用的两种编程语言(Matlab和Python)示例,让读者边学边做,这样才能更好地掌握大数据处理与智能决策的基础知识。
本书没有过多的数学公式,简单易懂,可作为应用型本科和高等职业院校的教材, 也可作为对大数据处理与智能决策感兴趣的读者的入门级书籍。
本书介绍的算法和工具都需要动手实践才能更好地理解,因此在每种算法详解后都附有当前最常用的两种编程语言(Matlab和Python)示例,让读者边学边做,这样才能更好地掌握大数据处理与智能决策的基础知识。
本书没有过多的数学公式,简单易懂,可作为应用型本科和高等职业院校的教材, 也可作为对大数据处理与智能决策感兴趣的读者的入门级书籍。
目录
第1章 导论 1
1.1 大数据处理的特点 1
1.1.1 业务驱动大数据发展 1
1.1.2 大数据的“4V”特征 2
1.2 大数据处理方法概述 3
1.2.1 大数据的分析处理方法 3
1.2.2 数据预处理 3
1.2.3 机器学习和数据挖掘 4
1.2.4 数据可视化 8
本章小结 10
练习题 10
第2章 基础数学知识 11
2.1 向量与矩阵 11
2.1.1 基本概念 11
2.1.2 向量的基本运算 12
2.1.3 矩阵的基本运算 13
2.1.4 特殊类型的向量与矩阵 14
2.2 基本描述性特征 15
2.2.1 集中趋势 15
2.2.2 离散趋势 16
2.2.3 协方差与相关系数 17
2.2.4 分布形态 19
2.3 数据的图形化描述 20
2.3.1 直方图 21
2.3.2 气泡图 22
2.3.3 箱型图 23
2.3.4 雷达图 25
2.3.5 等高线图 26
本章小结 28
练习题 28
第3章 数据预处理 31
3.1 数据度量 31
3.1.1 数据度量标准 31
3.1.2 数据归一化 32
3.1.3 数据清洗 33
3.1.4 数据预处理的其他方法 35
3.2 实验与代码 38
本章小结 39
练习题 40
第4章 线性回归算法 41
4.1 多项式拟合 41
4.2 线性回归算法 42
4.2.1 一元线性回归算法 42
4.2.2 多元线性回归算法 47
4.3 实验与代码 50
本章小结 51
练习题 51
第5章 聚类算法 53
5.1 聚类算法的概念及应用 53
5.2 距离度量 54
5.2.1 欧几里得距离 55
5.2.2 马哈拉诺比斯距离 56
5.2.3 曼哈顿距离 57
5.2.4 切比雪夫距离 58
5.2.5 闵可夫斯基距离 59
5.2.6 余弦相似度 60
5.2.7 汉明距离 61
5.3 KMeans算法介绍 62
5.3.1 KMeans算法基本步骤 62
5.3.2 KMeans算法关键点 65
5.4 KMeans++算法 66
5.5 二分KMeans算法 67
5.6 Mean Shift聚类算法 68
5.7 实验与代码 69
本章小结 73
练习题 73
第6章 分类算法 75
6.1 邻距与交叉验证 75
6.1.1 邻距 75
6.1.2 交叉验证 76
6.2 KNN算法介绍 79
6.2.1 KNN算法概述 79
6.2.2 KNN算法实现步骤 79
6.2.3 KNN算法的优缺点 79
6.3 支持向量机模型 80
6.3.1 模型原理分析 80
6.3.2 模型应用示例 80
6.4 实验与代码 86
本章小结 88
练习题 89
第7章 大数据集下的机器学习案例 91
7.1 TensorFlow 91
7.1.1 TensorFlow介绍 91
7.1.2 其他深度学习框架 91
7.1.3 使用TensorFlow的原因 92
7.2 TensorFlow环境搭建 93
7.2.1 TensorFlow运行环境 93
7.2.2 下载安装Anaconda 93
7.2.3 安装Pycharm 94
7.2.4 Windows平台下安装TensorFlow 97
7.3 TensorFlow典型应用案例:一元线性回归 100
7.3.1 准备数据 100
7.3.2 搭建模型 101
7.3.3 迭代训练模型 103
7.3.4 模型测试 105
7.4 实际大数据集案例:MNIST手写体数据集 106
7.4.1 MNIST数据集介绍 106
7.4.2 下载和导入MNIST数据集 107
7.4.3 使用TensorFlow构建KNN分类器对MNIST数据集进行分类 109
7.5 深度学习 111
7.5.1 深度学习的概念 111
7.5.2 人工智能的三起三落 113
7.5.3 神经网络 114
7.5.4 卷积神经网络 116
7.5.5 卷积神经网络在MNIST手写体数据集上的识别代码 118
本章小结 120
练习题 120
1.1 大数据处理的特点 1
1.1.1 业务驱动大数据发展 1
1.1.2 大数据的“4V”特征 2
1.2 大数据处理方法概述 3
1.2.1 大数据的分析处理方法 3
1.2.2 数据预处理 3
1.2.3 机器学习和数据挖掘 4
1.2.4 数据可视化 8
本章小结 10
练习题 10
第2章 基础数学知识 11
2.1 向量与矩阵 11
2.1.1 基本概念 11
2.1.2 向量的基本运算 12
2.1.3 矩阵的基本运算 13
2.1.4 特殊类型的向量与矩阵 14
2.2 基本描述性特征 15
2.2.1 集中趋势 15
2.2.2 离散趋势 16
2.2.3 协方差与相关系数 17
2.2.4 分布形态 19
2.3 数据的图形化描述 20
2.3.1 直方图 21
2.3.2 气泡图 22
2.3.3 箱型图 23
2.3.4 雷达图 25
2.3.5 等高线图 26
本章小结 28
练习题 28
第3章 数据预处理 31
3.1 数据度量 31
3.1.1 数据度量标准 31
3.1.2 数据归一化 32
3.1.3 数据清洗 33
3.1.4 数据预处理的其他方法 35
3.2 实验与代码 38
本章小结 39
练习题 40
第4章 线性回归算法 41
4.1 多项式拟合 41
4.2 线性回归算法 42
4.2.1 一元线性回归算法 42
4.2.2 多元线性回归算法 47
4.3 实验与代码 50
本章小结 51
练习题 51
第5章 聚类算法 53
5.1 聚类算法的概念及应用 53
5.2 距离度量 54
5.2.1 欧几里得距离 55
5.2.2 马哈拉诺比斯距离 56
5.2.3 曼哈顿距离 57
5.2.4 切比雪夫距离 58
5.2.5 闵可夫斯基距离 59
5.2.6 余弦相似度 60
5.2.7 汉明距离 61
5.3 KMeans算法介绍 62
5.3.1 KMeans算法基本步骤 62
5.3.2 KMeans算法关键点 65
5.4 KMeans++算法 66
5.5 二分KMeans算法 67
5.6 Mean Shift聚类算法 68
5.7 实验与代码 69
本章小结 73
练习题 73
第6章 分类算法 75
6.1 邻距与交叉验证 75
6.1.1 邻距 75
6.1.2 交叉验证 76
6.2 KNN算法介绍 79
6.2.1 KNN算法概述 79
6.2.2 KNN算法实现步骤 79
6.2.3 KNN算法的优缺点 79
6.3 支持向量机模型 80
6.3.1 模型原理分析 80
6.3.2 模型应用示例 80
6.4 实验与代码 86
本章小结 88
练习题 89
第7章 大数据集下的机器学习案例 91
7.1 TensorFlow 91
7.1.1 TensorFlow介绍 91
7.1.2 其他深度学习框架 91
7.1.3 使用TensorFlow的原因 92
7.2 TensorFlow环境搭建 93
7.2.1 TensorFlow运行环境 93
7.2.2 下载安装Anaconda 93
7.2.3 安装Pycharm 94
7.2.4 Windows平台下安装TensorFlow 97
7.3 TensorFlow典型应用案例:一元线性回归 100
7.3.1 准备数据 100
7.3.2 搭建模型 101
7.3.3 迭代训练模型 103
7.3.4 模型测试 105
7.4 实际大数据集案例:MNIST手写体数据集 106
7.4.1 MNIST数据集介绍 106
7.4.2 下载和导入MNIST数据集 107
7.4.3 使用TensorFlow构建KNN分类器对MNIST数据集进行分类 109
7.5 深度学习 111
7.5.1 深度学习的概念 111
7.5.2 人工智能的三起三落 113
7.5.3 神经网络 114
7.5.4 卷积神经网络 116
7.5.5 卷积神经网络在MNIST手写体数据集上的识别代码 118
本章小结 120
练习题 120