注册 登录 进入教材巡展
#
  • #

出版时间:2018-01

出版社:武汉大学出版社

以下为《基于人工智能的多媒体数据挖掘和应用实例》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 武汉大学出版社
  • 9787307199569
  • 274405
  • 2018-01
作者简介
李宗荣,在攻读了理学和哲学博士学位张鸿,武汉科技大学教授,研究方向人工智能、信息检索、机器学习与统计分析、数据挖掘,国内核心期刊《中国图象图形学报》审稿人,SCI检索的国际期刊Neurocomputing,Multimedia Tools and Application,Signal Processing等的审稿人 ,主要著作《多媒体信息的融合分析与综合检索》等。之后,进入到心理学领域。1995年在美国密苏里大学学习心理学,2012年游学于中国华中科技大学与加拿大麦吉尔大学,同年9月注册为华中科技大学系统科学理论专业的博士生,2014年攻读马克思主义哲学专业博士学位。
查看全部
内容简介
本书较系统地讲述了基于人工智能的多媒体数据挖掘和应用技术。全书共四个部分,十二个章节,首先以文本和图像为例,介绍了什么是从数据到语义的理解和挖掘;然后详细阐述了如何从底层内容特征的角度,建立多媒体数据的特征表达模型;并在此基础上,进一步以多模态数据为对象,介绍了目前的热点应用,即:跨媒体检索。最后,从数据结构关系和数据存储两个方面,扩展分析了复杂数据环境下的多媒体语义挖掘方法。
目录
第一部分 多媒体数据挖掘概述
第一章 从数据到语义的理解与挖掘
1.1 相关背景
1.2 信息检索的基本概念
1.3 纯文本信息的检索
1.3.1 技术背景
1.3.2 经典模型
1.4 基于关键字的多媒体检索
1.5 本章小结
第二章 图像数据挖掘概述——以CBIR为例
2.1 基本概念
2.2 主要技术流程和经典算法
2.2.1 特征建模
2.2.2 特征降维与索引
2.2.3 语义相似度度量
2.2.4 基于相关反馈的结果优化
2.3 CBIR的相关应用
2.3.1 国外CBIR开发简介
2.3.2 数字图书馆中基于内容的多媒体检索
2.4 本章小结

第二部分 多媒体数据的底层特征分析技术
第三章 图像的视觉特征分析方法
3.1 基本概念
3.1.1 数字图像的组成和存储
3.1.2 图像的特征类型和表达方式
3.2 经典的视觉特征及其计算方法
3.2.1 颜色特征
3.2.2 纹理特征
3.2.3 形状特征
3.3 特征降维的关键技术
3.3.1 线性降维方法
3.3.2 非线性降维方法
3.4 基于深度学习的图像特征表示
3.5 本章小结
第四章 视频多模态底层特征的综合理解
4.1 视频时序性特征的结构化
4.2 视频关键帧的计算方法
4.3 视频镜头的自动分割
4.4 视频特征的融合分析和深度挖掘
4.5 视频数据挖掘的相关应用
4.6 本章小结
第五章 音频时序性特征的结构化方法
5.1 基本概念
5.2 听觉特征的形式化表达和计算
5.2.1 时域特征
5.2.2 频域特征
5.2.3 压缩域特征
5.2.4 特征计算的基本单位
5.3 音频数据挖掘的相关应用
5.3.1 基于内容的音频检索
5.3.2 音乐信号分析
5.3.3 音频流的自动分割
5.4 本章小结
第六章 多模态特征的综合分析
6.1 底层异构特征间的内容鸿沟
6.2 异构特征间的统计相关性挖掘
6.2.1 数学模型
6.2.2 多模态特征综合分析实例:图像和音频特征间的典型相关性分析
6.2.3 技术特点
6.3 实验测试和结果分析
6.3.1 数据收集和特征提取
6.3.2 实验环境和参数设置
6.3.3 扩展实验
6.4 本章小结

第三部分 多模态数据挖掘实例:跨媒体检索
第七章 跨媒体检索基础知识
7.1 跨媒体的基本概念
7.1.1 人脑对多模态信息的认知特性
7.1.2 跨媒体数据挖掘的主要范畴
7.1.3 跨媒体检索的重要意义
7.2 跨媒体检索的相关研究与应用
7.2.1 多特征的融合分析与挖掘
7.2.2 跨媒体潜在关联挖掘
7.2.3 跨语言检索
7.2.4 视频中的说话人脸检测
7.2.5 多媒体交叉索引技术
7.3 本章小结
第八章 跨媒体检索系统的仿真实例
8.1 基于子空间映射的多模态数据表达
8.2 跨媒体距离的综合度量
8.3 基于相关反馈的跨媒体检索结果优化
8.3.1 算法描述
8.3.2 算法分析
8.4 新数据的引入
8.5 实验测试和结果分析
8.5.1 子空间维数的选取
8.5.2 跨媒体检索结果
8.5.3 相关反馈的实验结果
8.5.4 扩展实验
8.6 本章小结
第九章 基于隐性语义索引的跨媒体检索
9.1 跨媒体的特征共生矩阵
9.1.1 隐性语义索引
9.1.2 视觉和听觉特征的共生估计
9.2 相关性融合与优化算法
9.2.1 形式化描述
9.2.2 算法分析
9.3 主动学习策略
9.3.1 主动学习的概念
9.3.2 候选集计算
9.3.3 条件概率计算
9.3.4 主动学习规则
9.4 实验测试和结果分析
9.4.1 矩阵秩的选取
9.4.2 主动学习策略对检索性能的影响
9.4.3 LSI-Active-和CCA-Passive两种线性方法的性能对比
9.5 本章小结
第十章 Web环境中的跨媒体数据挖掘
10.1 基于Web的信息检索
10.2 跨媒体关联图的建模过程
10.2.1 预处理过程
10.2.2 链接分析
10.2.3 图模型的定义
10.3 基于图模型的全局相关性推理
10.4 跨媒体关联图的更新策略
10.5 本章小结

第四部分 复杂数据环境下的多媒体语义挖掘
第十一章 复杂数据关系的非线性分析
11.1 相关概念
11.1.1 复杂数据关系
11.1.2 非线性模型
11.2 流形学习模型
11.2.1 流形与流形学习
11.2.2 经典的流形学习方法
11.3 复杂数据关系的非线性流形建模
11.3.1 多特征观测空间
11.3.2 流形学习之:构造邻接图
11.3.3 流形学习之:计算测地线距离和子空间坐标
11.4 短期修正和长期修正策略
11.5 增量学习能力探讨
11.5.1 几何方法
11.5.2 交互方法
11.6 应用实例分析
11.6.1 多模态检索
11.6.2 图像和音频之间的跨媒体检索
11.6.3 新数据的引入
11.7 本章小结
第十二章 海量多媒体资源的网格化存储
12.1 海量多媒体资源的存储问题
12.2 网格相关知识
12.2.1 定义和特征
12.2.2 体系结构
12.2.3 网格的类型
12.2.4 网格资源管理
12.2.5 相关应用项目
12.3 仿真环境下的网格设计:以数字图书馆应用为例
12.3.1 系统构架
12.3.2 虚拟多媒体资源空间
12.3.3 检索算法设计
12.3.4 网格服务的发布和使用
12.4 本章小结
附录
参考文献
后记
Baidu
map