卷积神经网络与计算机视觉 / 智能科学与技术丛书
¥99.00定价
作者: [澳]萨尔曼·汗,侯赛因·拉哈马尼等著;黄智濒,戴志涛译
出版时间:2019-04
出版社:机械工业出版社
- 机械工业出版社
- 9787111622888
- 1版
- 283850
- 47229561-7
- 平装
- 16开
- 2019-04
- 294
- 196
- 工学
- 计算机科学与技术
- 计算机通信类
- 本科
作者简介
内容简介
本书自成一体,如果你既想了解CNN的原理,又想获得将CNN应用于计算机视觉的一手经验,那么本书将非常适合阅读。书中对CNN进行了全面介绍,首先是神经网络的基本概念:训练、正则化和优化。然后讨论了各种各样的损失函数、网络层和流行的CNN架构,回顾了评价CNN的不同技术,并介绍了一些常用的CNN工具和库。此外,本书还分析了CNN在计算机视觉中的应用案例,包括图像分类、对象检测、语义分割、场景理解和图像生成。
目录
译者序
前言
致谢
作者简介
第1章简介
1.1什么是计算机视觉
1.1.1应用案例
1.1.2图像处理与计算机视觉
1.2什么是机器学习
1.2.1为什么需要深度学习
1.3本书概览
第2章特征和分类器
2.1特征和分类器的重要性
2.1.1特征
2.1.2分类器
2.2传统特征描述符
2.2.1方向梯度直方图
2.2.2尺度不变特征变换
2.2.3加速健壮特征
2.2.4传统的手工工程特征的局限性
2.3机器学习分类器
2.3.1支持向量机
2.3.2随机决策森林
2.4总结
第3章神经网络基础
3.1引言
3.2多层感知机
3.2.1基础架构
3.2.2参数学习
3.3循环神经网络
3.3.1基础架构
3.3.2参数学习
3.4与生物视觉的关联
3.4.1生物神经元模型
3.4.2神经元的计算模型
3.4.3人工神经元与生物神经元
第4章卷积神经网络
4.1引言
4.2神经网络层
4.2.1预处理
4.2.2卷积层
4.2.3池化层
4.2.4非线性
4.2.5全连接层
4.2.6转置卷积层
4.2.7感兴趣区域的池化层
4.2.8空间金字塔池化层
4.2.9局部特征聚合描述符层
4.2.10空间变换层
4.3CNN损失函数
4.3.1交叉熵损失函数
4.3.2SVM铰链损失函数
4.3.3平方铰链损失函数
4.3.4欧几里得损失函数
4.3.51误差
4.3.6对比损失函数
4.3.7期望损失函数
4.3.8结构相似性度量
第5章CNN学习
5.1权重初始化
5.1.1高斯随机初始化
5.1.2均匀随机初始化
5.1.3正交随机初始化
5.1.4无监督的预训练
5.1.5泽维尔(Xavier)初始化
5.1.6ReLU敏感的缩放初始化
5.1.7层序单位方差
5.1.8有监督的预训练
5.2CNN的正则化
5.2.1数据增强
5.2.2随机失活
5.2.3随机失连
5.2.4批量归一化
5.2.5集成模型平均
5.2.62正则化
5.2.71正则化
5.2.8弹性网正则化
5.2.9最大范数约束
5.2.10早停
5.3基于梯度的CNN学习
5.3.1批量梯度下降
5.3.2随机梯度下降
5.3.3小批量梯度下降
5.4神经网络优化器
5.4.1动量
5.4.2涅斯捷罗夫动量
5.4.3自适应梯度
5.4.4自适应增量
5.4.5RMSprop
5.4.6自适应矩估计
5.5CNN中的梯度计算
5.5.1分析微分法
5.5.2数值微分法
5.5.3符号微分法
5.5.4自动微分法
5.6通过可视化理解CNN
5.6.1可视化学习的权重
5.6.2可视化激活
5.6.3基于梯度的可视化
第6章CNN架构的例子
6.1LeNet
6.2AlexNet
6.3NiN
6.4VGGnet
6.5GoogleNet
6.6ResNet
6.7ResNeXt
6.8FractalNet
6.9DenseNet
第7章CNN在计算机视觉中的应用
7.1图像分类
7.1.1PointNet
7.2目标检测与定位
7.2.1基于区域的CNN
7.2.2快速RCNN
7.2.3区域建议网络
7.3语义分割
7.3.1全卷积网络
7.3.2深度反卷积网络
7.3.3DeepLab
7.4场景理解
7.4.1DeepContext
7.4.2从RGBD图像中学习丰富的特征
7.4.3用于场景理解的PointNet
7.5图像生成
7.5.1生成对抗网络
7.5.2深度卷积生成对抗网络
7.5.3超分辨率生成对抗网络
7.6基于视频的动作识别
7.6.1静止视频帧的动作识别
7.6.2双流CNN
7.6.3长期递归卷积网络
第8章深度学习工具和库
8.1Caffe
8.2TensorFlow
8.3MatConvNet
8.4Torch7
8.5Theano
8.6Keras
8.7Lasagne
8.8Marvin
8.9Chainer
8.10PyTorch
第9章结束语
9.1本书概要
9.2未来研究方向
术语表
参考文献
前言
致谢
作者简介
第1章简介
1.1什么是计算机视觉
1.1.1应用案例
1.1.2图像处理与计算机视觉
1.2什么是机器学习
1.2.1为什么需要深度学习
1.3本书概览
第2章特征和分类器
2.1特征和分类器的重要性
2.1.1特征
2.1.2分类器
2.2传统特征描述符
2.2.1方向梯度直方图
2.2.2尺度不变特征变换
2.2.3加速健壮特征
2.2.4传统的手工工程特征的局限性
2.3机器学习分类器
2.3.1支持向量机
2.3.2随机决策森林
2.4总结
第3章神经网络基础
3.1引言
3.2多层感知机
3.2.1基础架构
3.2.2参数学习
3.3循环神经网络
3.3.1基础架构
3.3.2参数学习
3.4与生物视觉的关联
3.4.1生物神经元模型
3.4.2神经元的计算模型
3.4.3人工神经元与生物神经元
第4章卷积神经网络
4.1引言
4.2神经网络层
4.2.1预处理
4.2.2卷积层
4.2.3池化层
4.2.4非线性
4.2.5全连接层
4.2.6转置卷积层
4.2.7感兴趣区域的池化层
4.2.8空间金字塔池化层
4.2.9局部特征聚合描述符层
4.2.10空间变换层
4.3CNN损失函数
4.3.1交叉熵损失函数
4.3.2SVM铰链损失函数
4.3.3平方铰链损失函数
4.3.4欧几里得损失函数
4.3.51误差
4.3.6对比损失函数
4.3.7期望损失函数
4.3.8结构相似性度量
第5章CNN学习
5.1权重初始化
5.1.1高斯随机初始化
5.1.2均匀随机初始化
5.1.3正交随机初始化
5.1.4无监督的预训练
5.1.5泽维尔(Xavier)初始化
5.1.6ReLU敏感的缩放初始化
5.1.7层序单位方差
5.1.8有监督的预训练
5.2CNN的正则化
5.2.1数据增强
5.2.2随机失活
5.2.3随机失连
5.2.4批量归一化
5.2.5集成模型平均
5.2.62正则化
5.2.71正则化
5.2.8弹性网正则化
5.2.9最大范数约束
5.2.10早停
5.3基于梯度的CNN学习
5.3.1批量梯度下降
5.3.2随机梯度下降
5.3.3小批量梯度下降
5.4神经网络优化器
5.4.1动量
5.4.2涅斯捷罗夫动量
5.4.3自适应梯度
5.4.4自适应增量
5.4.5RMSprop
5.4.6自适应矩估计
5.5CNN中的梯度计算
5.5.1分析微分法
5.5.2数值微分法
5.5.3符号微分法
5.5.4自动微分法
5.6通过可视化理解CNN
5.6.1可视化学习的权重
5.6.2可视化激活
5.6.3基于梯度的可视化
第6章CNN架构的例子
6.1LeNet
6.2AlexNet
6.3NiN
6.4VGGnet
6.5GoogleNet
6.6ResNet
6.7ResNeXt
6.8FractalNet
6.9DenseNet
第7章CNN在计算机视觉中的应用
7.1图像分类
7.1.1PointNet
7.2目标检测与定位
7.2.1基于区域的CNN
7.2.2快速RCNN
7.2.3区域建议网络
7.3语义分割
7.3.1全卷积网络
7.3.2深度反卷积网络
7.3.3DeepLab
7.4场景理解
7.4.1DeepContext
7.4.2从RGBD图像中学习丰富的特征
7.4.3用于场景理解的PointNet
7.5图像生成
7.5.1生成对抗网络
7.5.2深度卷积生成对抗网络
7.5.3超分辨率生成对抗网络
7.6基于视频的动作识别
7.6.1静止视频帧的动作识别
7.6.2双流CNN
7.6.3长期递归卷积网络
第8章深度学习工具和库
8.1Caffe
8.2TensorFlow
8.3MatConvNet
8.4Torch7
8.5Theano
8.6Keras
8.7Lasagne
8.8Marvin
8.9Chainer
8.10PyTorch
第9章结束语
9.1本书概要
9.2未来研究方向
术语表
参考文献