注册 登录 进入教材巡展
#

出版时间:2024-06

出版社:电子工业出版社

以下为《声音信号处理与项目实践》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 电子工业出版社
  • 9787121487521
  • 1-1
  • 540946
  • 16开
  • 2024-06
  • 电子信息与电气
  • 本科 研究生及以上
内容简介
本书系统介绍了声音信号处理的背景知识、发展历史以及研究现状与趋势,并详细阐述了基础原理、处理方法、实践应用、新成果与新技术。 全书共9章。第1章绪论,第2章声音信号简介,第3章短时时域处理技术,第4章短时傅里叶变换,第5章声音信号的线性预测,第6章语音编码,第7章声音合成与转换,第8章语音识别,第9章基于深度学习技术的声音技术应用。 本书体系完整,结构严谨,系统性强,原理阐述透彻,联系实际应用,凸显理论与实践结合,包含丰富的实践案例。本书可作为高等院校信号与信息处理、通信与电子工程、模式识别与人工智能等专业高年级本科生及研究生教材,也可供该领域的科研及工程技术人员参考。
目录
目 录__eol__第1章 绪论 1__eol__1.1 声音信号处理的研究内容 1__eol__1.2 声音信号处理的发展历史 2__eol__1.2.1 语音编码算法的发展历史 3__eol__1.2.2 语音识别算法的发展历史 4__eol__1.2.3 语音去噪及增强算法的发展历史 5__eol__1.2.4 语音合成转换等其他算法的发展历史 7__eol__1.2.5 基于语音和视觉信息的多模态融合方法 11__eol__1.3 声音效果评价 14__eol__1.3.1 主观评价方法 14__eol__1.3.2 客观评价方法 15__eol__练习题 16__eol__第2章 声音信号简介 17__eol__2.1 人类语音信号的产生 17__eol__2.2 语音信号的基本特征 18__eol__2.3 声音的特征提取 19__eol__2.3.1 手工声音特征 19__eol__2.3.2 深度语音情感特征 19__eol__2.4 人类的听觉感知 20__eol__2.5 语音数据库 22__eol__2.5.1 语音识别数据集 22__eol__2.5.2 语音情感数据库 23__eol__2.5.3 多模态情感数据集 24__eol__练习题 26__eol__第3章 短时时域处理技术 27__eol__3.1 语音信号的短时处理方法 27__eol__3.1.1 语音端点检测 27__eol__3.1.2 预加重 28__eol__3.1.3 分帧与加窗 28__eol__3.2 短时能量和短时平均幅度 30__eol__3.3 短时过零率 33__eol__3.4 短时自相关函数 35__eol__3.5 短时时域处理技术案例:基音提取 35__eol__3.5.1 基音检测估计方法1:三电平削波法 36__eol__3.5.2 基音检测估计方法2:SHR谐波检测法 40__eol__练习题 42__eol__第4章 短时傅里叶变换 44__eol__4.1 短时傅里叶变换的定义 44__eol__4.2 短时傅里叶变换的理解 45__eol__4.3 短时傅里叶变换的实现 49__eol__4.4 语音短时傅里叶变换的应用案例 50__eol__4.4.1 梅尔频率倒谱系数的提取和应用 50__eol__4.4.2 声音去噪算法的实现 57__eol__4.4.3 声音信号熵的提取应用 62__eol__练习题 69__eol__第5章 声音信号的线性预测编码 70__eol__5.1 线性预测基本原理 70__eol__5.2 线性预测的解析算法 73__eol__5.3 线性预测的应用案例 76__eol__5.3.1 基音检测估计 77__eol__5.3.2 共振峰估计 81__eol__练习题 85__eol__第6章 语音编码 86__eol__6.1 脉冲编码调制 87__eol__6.1.1 均匀量化脉冲编码调制 87__eol__6.1.2 非均匀量化脉冲编码调制 87__eol__6.1.3 自适应量化脉冲编码调制 88__eol__6.2 差分脉冲编码 89__eol__6.2.1 差分脉冲编码原理 89__eol__6.2.2 自适应差分脉冲编码 91__eol__6.3 增量调制 95__eol__6.3.1 增量调制原理 95__eol__6.3.2 自适应增量调制原理 95__eol__6.4 基于线性预测编码的声码器 96__eol__6.4.1 LPC-10声码器 96__eol__6.4.2 码激励线性预测编码 102__eol__练习题 107__eol__第7章 声音合成与转换 109__eol__7.1 语音合成方法 109__eol__7.1.1 参数合成方法 110__eol__7.1.2 波形合成方法 115__eol__7.2 汉语基于音节的规则合成方法 120__eol__7.2.1 韵律规则合成 121__eol__7.2.2 多音节协同发音规则合成 129__eol__7.2.3 轻声音节规则合成 130__eol__7.3 语音转换方法 131__eol__7.3.1 语音转换系统的总体框架 131__eol__7.3.2 语音转换常见的特征参数 132__eol__7.4 语音转换评价指标 134__eol__7.4.1 客观评价 135__eol__7.4.2 主观评价 135__eol__7.5 语音转换应用案例 136__eol__7.5.1 平行语音转换方法 136__eol__7.6 非平行语音转换应用案例 139__eol__7.6.1 循环生成对抗网络 139__eol__7.6.2 星型生成对抗网络 140__eol__7.6.3 变分自动编码器 141__eol__7.6.4 自适应实例规范化 141__eol__7.6.5 激活引导和自适应实例归一化 142__eol__练习题 150__eol__第8章 语音识别 151__eol__8.1 采用矢量量化的说话人识别 151__eol__8.1.1 矢量量化的原理 151__eol__8.1.2 矢量量化的训练 152__eol__8.1.3 矢量量化说话人识别的实现 153__eol__8.2 采用动态时间规整的孤立词识别 154__eol__8.3 基于隐马尔可夫模型的语音(语句)识别 159__eol__8.3.1 HMM模型 159__eol__8.3.2 HMM的概率求解 161__eol__8.3.3 HMM的解码 164__eol__8.3.4 HMM的训练 166__eol__8.3.5 HMM-GMM模型 171__eol__8.3.6 基于HMM的语音识别应用案例 173__eol__练习题 180__eol__第9章 基于深度学习模型的声音技术应用 183__eol__9.1 深度学习网络基础 183__eol__9.1.1 深度学习网络基本结构 183__eol__9.1.2 深度学习网络的训练 185__eol__9.1.3 卷积神经网络 187__eol__9.1.4 循环神经网络 191__eol__9.1.5 注意力机制 197__eol__9.2 基于深度学习的声音去噪算法 198__eol__9.2.1 基于深度神经网络幅度谱估计的深度学习声音去噪算法 198__eol__9.2.2 基于多尺度时频卷积网络的多通道声音去噪 201__eol__9.3 基于深度学习的语音识别应用案例 205__eol__9.3.1 基于循环神经网络-连续时序分类的语音识别 206__eol__9.3.2 基于卷积神经网络的语音识别 209__eol__9.3.3 基于Transformer的语音识别 211__eol__9.4 基于ResNet的语音情感识别应用案例 220__eol__9.5 声音与呼吸信号联合识别应用案例 225__eol__9.6 声音与人脸联合识别应用案例 228__eol__练习题 231__eol__参考文献 232__eol__
Baidu
map