Python编程与计算机视觉应用 / 高等学校计算机类专业系列教材
¥47.00定价
作者: 刘国华
出版时间:2023-05
出版社:西安电子科技大学出版社
- 西安电子科技大学出版社
- 9787560668369
- 1-1
- 514038
- 49242204-3
- 平装
- 16开
- 2023-05
- 383
- 260
- TP311.561
- 自动化技术、计算机技术
- 本科 高职
内容简介
本书共11章,分为三部分。第一部分(第1章至第5章)介绍了Python在计算机视觉中的图像基本操作、图像增强、形态学处理、局部图像特征提取、图像分割等方面的编程应用。第二部分(第6章至第8章)梳理了计算机视觉的相关基础理论,包括深度神经网络基础、卷积神经网络基础和PyTorch深度学习框架。第三部分(第9章至第11章)列举了Python在计算机视觉中的典型应用,即在图像分类、目标检测和语义分割中的应用。各章都附有相关的习题,可供自学练习,以便读者加深对本书所述内容的理解。
本书深度适中,内容力求精练,可作为高等学校计算机科学与技术、电子信息工程、通信与信息工程等专业本科生与研究生的教材,也可供人工智能、模式识别等相关领域的科研人员和工程技术人员参考。
本书深度适中,内容力求精练,可作为高等学校计算机科学与技术、电子信息工程、通信与信息工程等专业本科生与研究生的教材,也可供人工智能、模式识别等相关领域的科研人员和工程技术人员参考。
目录
第1章 图像基本操作 1
1.1 软件安装及环境配置 1
1.1.1 Anaconda安装 1
1.1.2 PyCharm安装 4
1.1.3 在Python中安装图像处理库 7
1.2 基于PIL的图像处理 8
1.2.1 读取及保存图像 8
1.2.2 图像区域的裁剪和粘贴 10
1.2.3 调整图像尺寸和旋转图像 11
1.2.4 其他图像处理操作 12
1.3 基于Matplotlib的图像处理 16
1.3.1 绘制点和线 16
1.3.2 绘制图像轮廓和直方图 17
1.3.3 分离与合并图像的通道 19
1.4 基于NumPy的图像处理 20
1.4.1 图像的数组化 20
1.4.2 图像的灰度变换 21
1.5 基于SciPy的图像处理 23
1.5.1 图像模糊 23
1.5.2 图像导数 25
1.6 基于scikit-image的图像处理 28
1.6.1 图像的旋流变换 28
1.6.2 图像的添噪 29
本章小结 30
习题 30
第2章 图像增强 32
2.1 图像增强的概念和分类 32
2.2 强度变换 33
2.2.1 图像的二值化 34
2.2.2 图像的对比度拉伸 36
2.2.3 彩色图像的对数变换 40
2.2.4 彩色图像的幂律变换 41
2.3 直方图处理 43
2.3.1 直方图均衡化 43
2.3.2 直方图匹配 44
2.4 图像的平滑 47
2.4.1 图像噪声 47
2.4.2 线性噪声平滑 48
2.4.3 非线性噪声平滑 52
2.5 图像的锐化 57
2.5.1 一阶微分算子法 57
2.5.2 拉普拉斯算子法 62
2.5.3 锐化和反锐化掩模 64
本章小结 67
习题 67
第3章 形态学处理 68
3.1 数学形态学基础知识 68
3.2 二值图像的形态学处理 70
3.2.1 腐蚀 70
3.2.2 膨胀 71
3.2.3 开、闭运算 73
3.2.4 骨架化 76
3.2.5 边界提取 78
3.2.6 孔洞填充 79
3.2.7 白顶帽与黑顶帽变换 82
3.3 灰度图像的形态学处理 83
3.3.1 灰度腐蚀 83
3.3.2 灰度膨胀 85
3.3.3 灰度开、闭运算 87
本章小结 91
习题 91
第4章 局部图像特征提取 92
4.1 特征检测器与描述符 92
4.2 Harris角点检测器 93
4.2.1 角点检测 93
4.2.2 角点匹配 96
4.3 斑点检测器 101
4.4 尺度不变特征变换 104
4.4.1 兴趣点 105
4.4.2 描述符 105
4.4.3 检测兴趣点 106
4.4.4 匹配描述符 107
本章小结 112
习题 112
第5章 图像分割 113
5.1 基于阈值的图像分割 113
5.2 基于边缘或区域的图像分割 115
5.2.1 基于边缘的图像分割 117
5.2.2 基于区域的图像分割 119
5.3 图割 122
5.3.1 从图像创建图 124
5.3.2 用户交互式分割 128
5.4 使用聚类进行分割 131
5.4.1 k-means聚类 131
5.4.2 谱聚类 131
5.4.3 聚类分割算法 132
5.5 其他分割算法 135
5.5.1 菲尔森茨瓦布算法 135
5.5.2 活动轮廓算法 137
本章小结 139
习题 139
第6章 深度神经网络基础 140
6.1 神经网络的基本概念 140
6.2 神经网络的基本结构 142
6.3 监督学习和无监督学习 142
6.3.1 监督学习 143
6.3.2 无监督学习 144
6.4 欠拟合和过拟合 145
6.4.1 欠拟合 146
6.4.2 过拟合 146
6.5 反向传播 147
6.6 损失和优化 149
6.6.1 损失函数 149
6.6.2 优化函数 150
6.7 激活函数 152
6.7.1 Sigmoid函数 153
6.7.2 tanh函数 154
6.7.3 ReLU函数 155
本章小结 156
习题 156
第7章 卷积神经网络基础 157
7.1 卷积神经网络的基本概念 157
7.2 卷积神经网络的基本结构 158
7.2.1 卷积层 159
7.2.2 池化层 161
7.2.3 全连接层 162
7.3 卷积运算与边缘检测 163
7.4 填充与卷积步距 165
7.5 单层卷积神经网络 167
7.6 卷积神经网络范例 168
本章小结 169
习题 170
第8章 PyTorch深度学习框架 171
8.1 PyTorch框架简介 171
8.2 PyTorch环境配置与安装 174
8.3 PyTorch中的Tensor 176
8.3.1 Tensor的创建 176
8.3.2 Tensor的基本操作 179
8.4 PyTorch常用模块及库 181
8.4.1 torch.autograd模块(自动求导) 181
8.4.2 torch.nn模块 184
8.4.3 torch.optim模块 186
8.4.4 torchvision库 187
本章小结 189
习题 189
第9章 计算机视觉应用——图像分类 190
9.1 图像分类简介 190
9.2 VGGNet的基本原理 191
9.2.1 VGGNet的起源 191
9.2.2 CNN网络结构中感受野的概念 192
9.2.3 VGGNet的基本网络结构 194
9.2.4 VGGNet模型的代码实现 196
9.3 训练过程 198
9.3.1 数据集准备(花卉数据集) 198
9.3.2 图像数据预处理 202
9.3.3 训练VGG网络 203
9.4 模型结果评估 207
本章小结 210
习题 210
第10章 计算机视觉应用——目标检测 211
10.1 目标检测简介 211
10.2 两阶段式目标检测网络
Faster R-CNN 212
10.2.1 特征提取部分 213
10.2.2 候选区域网络 213
10.2.3 兴趣域池化 215
10.2.4 分类回归部分 216
10.3 单阶段式目标检测网络YOLOv3 217
10.3.1 数据输入 218
10.3.2 特征提取网络DarkNet53 219
10.3.3 特征金字塔结构 222
10.3.4 YOLOv3中的锚框机制 223
10.3.5 损失函数 224
10.4 目标检测算法评价指标 226
10.4.1 综合指标 227
10.4.2 PR曲线与ROC曲线 228
10.4.3 均值平均精度mAP 229
本章小结 230
习题 230
第11章 计算机视觉应用——语义分割 231
11.1 语义分割概述 231
11.2 经典的语义分割模型 232
11.2.1 全卷积神经网络(FCN) 233
11.2.2 编-解码器卷积神经网络 234
11.2.3 DeepLab系列语义分割网络 241
11.3 语义分割常用数据集介绍 247
11.4 语义分割评价指标 248
本章小结 249
习题 250
参考文献 251
1.1 软件安装及环境配置 1
1.1.1 Anaconda安装 1
1.1.2 PyCharm安装 4
1.1.3 在Python中安装图像处理库 7
1.2 基于PIL的图像处理 8
1.2.1 读取及保存图像 8
1.2.2 图像区域的裁剪和粘贴 10
1.2.3 调整图像尺寸和旋转图像 11
1.2.4 其他图像处理操作 12
1.3 基于Matplotlib的图像处理 16
1.3.1 绘制点和线 16
1.3.2 绘制图像轮廓和直方图 17
1.3.3 分离与合并图像的通道 19
1.4 基于NumPy的图像处理 20
1.4.1 图像的数组化 20
1.4.2 图像的灰度变换 21
1.5 基于SciPy的图像处理 23
1.5.1 图像模糊 23
1.5.2 图像导数 25
1.6 基于scikit-image的图像处理 28
1.6.1 图像的旋流变换 28
1.6.2 图像的添噪 29
本章小结 30
习题 30
第2章 图像增强 32
2.1 图像增强的概念和分类 32
2.2 强度变换 33
2.2.1 图像的二值化 34
2.2.2 图像的对比度拉伸 36
2.2.3 彩色图像的对数变换 40
2.2.4 彩色图像的幂律变换 41
2.3 直方图处理 43
2.3.1 直方图均衡化 43
2.3.2 直方图匹配 44
2.4 图像的平滑 47
2.4.1 图像噪声 47
2.4.2 线性噪声平滑 48
2.4.3 非线性噪声平滑 52
2.5 图像的锐化 57
2.5.1 一阶微分算子法 57
2.5.2 拉普拉斯算子法 62
2.5.3 锐化和反锐化掩模 64
本章小结 67
习题 67
第3章 形态学处理 68
3.1 数学形态学基础知识 68
3.2 二值图像的形态学处理 70
3.2.1 腐蚀 70
3.2.2 膨胀 71
3.2.3 开、闭运算 73
3.2.4 骨架化 76
3.2.5 边界提取 78
3.2.6 孔洞填充 79
3.2.7 白顶帽与黑顶帽变换 82
3.3 灰度图像的形态学处理 83
3.3.1 灰度腐蚀 83
3.3.2 灰度膨胀 85
3.3.3 灰度开、闭运算 87
本章小结 91
习题 91
第4章 局部图像特征提取 92
4.1 特征检测器与描述符 92
4.2 Harris角点检测器 93
4.2.1 角点检测 93
4.2.2 角点匹配 96
4.3 斑点检测器 101
4.4 尺度不变特征变换 104
4.4.1 兴趣点 105
4.4.2 描述符 105
4.4.3 检测兴趣点 106
4.4.4 匹配描述符 107
本章小结 112
习题 112
第5章 图像分割 113
5.1 基于阈值的图像分割 113
5.2 基于边缘或区域的图像分割 115
5.2.1 基于边缘的图像分割 117
5.2.2 基于区域的图像分割 119
5.3 图割 122
5.3.1 从图像创建图 124
5.3.2 用户交互式分割 128
5.4 使用聚类进行分割 131
5.4.1 k-means聚类 131
5.4.2 谱聚类 131
5.4.3 聚类分割算法 132
5.5 其他分割算法 135
5.5.1 菲尔森茨瓦布算法 135
5.5.2 活动轮廓算法 137
本章小结 139
习题 139
第6章 深度神经网络基础 140
6.1 神经网络的基本概念 140
6.2 神经网络的基本结构 142
6.3 监督学习和无监督学习 142
6.3.1 监督学习 143
6.3.2 无监督学习 144
6.4 欠拟合和过拟合 145
6.4.1 欠拟合 146
6.4.2 过拟合 146
6.5 反向传播 147
6.6 损失和优化 149
6.6.1 损失函数 149
6.6.2 优化函数 150
6.7 激活函数 152
6.7.1 Sigmoid函数 153
6.7.2 tanh函数 154
6.7.3 ReLU函数 155
本章小结 156
习题 156
第7章 卷积神经网络基础 157
7.1 卷积神经网络的基本概念 157
7.2 卷积神经网络的基本结构 158
7.2.1 卷积层 159
7.2.2 池化层 161
7.2.3 全连接层 162
7.3 卷积运算与边缘检测 163
7.4 填充与卷积步距 165
7.5 单层卷积神经网络 167
7.6 卷积神经网络范例 168
本章小结 169
习题 170
第8章 PyTorch深度学习框架 171
8.1 PyTorch框架简介 171
8.2 PyTorch环境配置与安装 174
8.3 PyTorch中的Tensor 176
8.3.1 Tensor的创建 176
8.3.2 Tensor的基本操作 179
8.4 PyTorch常用模块及库 181
8.4.1 torch.autograd模块(自动求导) 181
8.4.2 torch.nn模块 184
8.4.3 torch.optim模块 186
8.4.4 torchvision库 187
本章小结 189
习题 189
第9章 计算机视觉应用——图像分类 190
9.1 图像分类简介 190
9.2 VGGNet的基本原理 191
9.2.1 VGGNet的起源 191
9.2.2 CNN网络结构中感受野的概念 192
9.2.3 VGGNet的基本网络结构 194
9.2.4 VGGNet模型的代码实现 196
9.3 训练过程 198
9.3.1 数据集准备(花卉数据集) 198
9.3.2 图像数据预处理 202
9.3.3 训练VGG网络 203
9.4 模型结果评估 207
本章小结 210
习题 210
第10章 计算机视觉应用——目标检测 211
10.1 目标检测简介 211
10.2 两阶段式目标检测网络
Faster R-CNN 212
10.2.1 特征提取部分 213
10.2.2 候选区域网络 213
10.2.3 兴趣域池化 215
10.2.4 分类回归部分 216
10.3 单阶段式目标检测网络YOLOv3 217
10.3.1 数据输入 218
10.3.2 特征提取网络DarkNet53 219
10.3.3 特征金字塔结构 222
10.3.4 YOLOv3中的锚框机制 223
10.3.5 损失函数 224
10.4 目标检测算法评价指标 226
10.4.1 综合指标 227
10.4.2 PR曲线与ROC曲线 228
10.4.3 均值平均精度mAP 229
本章小结 230
习题 230
第11章 计算机视觉应用——语义分割 231
11.1 语义分割概述 231
11.2 经典的语义分割模型 232
11.2.1 全卷积神经网络(FCN) 233
11.2.2 编-解码器卷积神经网络 234
11.2.3 DeepLab系列语义分割网络 241
11.3 语义分割常用数据集介绍 247
11.4 语义分割评价指标 248
本章小结 249
习题 250
参考文献 251