大数据治理:理论与方法
¥58.00定价
作者: 王宏志
出版时间:2024-01
出版社:电子工业出版社
- 电子工业出版社
- 9787121421815
- 1-5
- 421668
- 48253508-5
- 平塑勒
- 16开
- 2024-01
- 339
- 212
- 工学
- 计算机科学与技术
- 计算机科学与技术
- 本科 研究生及以上
目录
第1 章 大数据治理的背景和基本概念………………………………………………… 1__eol__ 1. 1 大数据治理的定义………………………………………………………… 2__eol__ 1. 2 大数据治理的应用………………………………………………………… 3__eol__ 1. 2. 1 大数据治理的任务…………………………………………………… 3__eol__ 1. 2. 2 数据治理与数据管理的区别…………………………………………… 4__eol__ 1. 2. 3 大数据治理的典型案例……………………………………………… 4__eol__ 1. 3 大数据治理的挑战………………………………………………………… 7__eol__ 1. 3. 1 大数据的发展和现状………………………………………………… 7__eol__ 1. 3. 2 当下面临的挑战……………………………………………………… 8__eol__ 1. 4 本书的主要内容…………………………………………………………… 9__eol__第2 章 数据架构管理……………………………………………………………… 11__eol__ 2. 1 数据架构概述…………………………………………………………… 12__eol__ 2. 2 IBM 数据架构参考模型………………………………………………… 13__eol__ 2. 2. 1 逻辑层……………………………………………………………… 14__eol__ 2. 2. 2 垂直层……………………………………………………………… 16__eol__ 2. 3 企业数据架构参考模型………………………………………………… 17__eol__ 2. 4 CESI 大数据参考架构模型……………………………………………… 18__eol__ 2. 5 大数据技术参考架构…………………………………………………… 19__eol__ 2. 6 数据湖(Data Lake) …………………………………………………… 20__eol__ 2. 7 面向大数据的数据架构实现…………………………………………… 21__eol__ 2. 7. 1 Hadoop ……………………………………………………………… 21__eol__ 2. 7. 2 Storm ……………………………………………………………… 23__eol__ 2. 7. 3 Spark ……………………………………………………………… 24__eol__ 2. 7. 4 三种架构的比较分析………………………………………………… 25__eol__ 2. 8 数据架构设计原则……………………………………………………… 25__eol__第3 章 元数据管理………………………………………………………………… 27__eol__ 3. 1 元数据概述……………………………………………………………… 28__eol__ 3. 1. 1 定义………………………………………………………………… 28__eol__ 3. 1. 2 组织方式…………………………………………………………… 29__eol__ 3. 1. 3 作用和意义………………………………………………………… 31__eol__ 3. 2 业务元数据……………………………………………………………… 32__eol__ 3. 2. 1 意义………………………………………………………………… 32__eol__ 3. 2. 2 概念………………………………………………………………… 33__eol__ 3. 2. 3 实践要点…………………………………………………………… 34__eol__ 3. 3 技术元数据……………………………………………………………… 34__eol__ 3. 3. 1 意义………………………………………………………………… 34__eol__ 3. 3. 2 概念………………………………………………………………… 35__eol__ 3. 3. 3 实践要点…………………………………………………………… 36__eol__ 3. 4 元数据管理……………………………………………………………… 36__eol__ 3. 4. 1 元数据管理方案…………………………………………………… 37__eol__ 3. 4. 2 元数据标准和规范………………………………………………… 39__eol__ 3. 4. 3 元数据管理的成熟度………………………………………………… 40__eol__第4 章 主数据管理………………………………………………………………… 42__eol__ 4. 1 概述……………………………………………………………………… 43__eol__ 4. 1. 1 主数据的概念……………………………………………………… 43__eol__ 4. 1. 2 主数据的类型……………………………………………………… 44__eol__ 4. 1. 3 主数据管理的基本思路……………………………………………… 44__eol__ 4. 2 主数据管理系统………………………………………………………… 45__eol__ 4. 2. 1 主数据管理的架构设计……………………………………………… 46__eol__ 4. 2. 2 主数据管理的核心功能……………………………………………… 50__eol__ 4. 2. 3 主数据管理的实现风格……………………………………………… 50__eol__ 4. 3 主数据管理的成熟度…………………………………………………… 52__eol__第5 章 大数据集成………………………………………………………………… 56__eol__ 5. 1 数据集成的基本概念…………………………………………………… 57__eol__ 5. 1. 1 数据集成的定义…………………………………………………… 57__eol__ 5. 1. 2 数据集成的分类…………………………………………………… 58__eol__ 5. 1. 3 数据集成的难点…………………………………………………… 59__eol__ 5. 2 传统数据集成…………………………………………………………… 60__eol__ 5. 2. 1 联邦数据库系统…………………………………………………… 61__eol__ 5. 2. 2 中间件集成………………………………………………………… 62__eol__ 5. 2. 3 数据仓库…………………………………………………………… 63__eol__ 5. 3 传统数据集成的关键技术……………………………………………… 65__eol__ 5. 3. 1 模式匹配…………………………………………………………… 65__eol__ 5. 3. 2 数据映射…………………………………………………………… 66__eol__ 5. 4 跨界数据集成…………………………………………………………… 67__eol__ 5. 4. 1 基于阶段的集成…………………………………………………… 67__eol__ 5. 4. 2 基于特征的集成…………………………………………………… 68__eol__ 5. 4. 3 基于语义的集成…………………………………………………… 68__eol__第6 章 数据质量管理……………………………………………………………… 71__eol__ 6. 1 概述……………………………………………………………………… 72__eol__ 6. 1. 1 数据质量定义……………………………………………………… 72__eol__ 6. 1. 2 数据质量问题……………………………………………………… 74__eol__ 6. 2 缺失值填充……………………………………………………………… 76__eol__ 6. 2. 1 什么是缺失值……………………………………………………… 76__eol__ 6. 2. 2 缺失值处理方法…………………………………………………… 77__eol__ 6. 2. 3 缺失值处理例析…………………………………………………… 79__eol__ 6. 3 实体识别与真值发现…………………………………………………… 81__eol__ 6. 3. 1 什么是实体识别…………………………………………………… 81__eol__ 6. 3. 2 基于规则的实体识别方法…………………………………………… 81__eol__ 6. 3. 3 什么是真值发现…………………………………………………… 84__eol__ 6. 3. 4 真值发现方法……………………………………………………… 85__eol__ 6. 5 错误检测与修复………………………………………………………… 85__eol__ 6. 5. 1 格式内容清洗……………………………………………………… 85__eol__ 6. 5. 2 逻辑错误清洗……………………………………………………… 86__eol__ 6. 5. 3 非需求数据清洗…………………………………………………… 87__eol__ 6. 6 面向大数据的