大数据分析:从理论到实践
¥49.00定价
作者: 成生辉
出版时间:2023-09
出版社:电子工业出版社
- 电子工业出版社
- 9787121412615
- 1-3
- 423560
- 66254678-7
- 平塑
- 16开
- 2023-09
- 239
- 172
- 工学
- 计算机科学与技术
- 电子与信息大类
- 高职
目录
第1章 引言 1__eol__1.1 大数据的发展历程 1__eol__1.2 大数据的概念和定义 3__eol__1.2.1 大量(Volume) 4__eol__1.2.2 多样(Variety) 5__eol__1.2.3 价值密度低(Value) 5__eol__1.2.4 高速(Velocity) 5__eol__1.2.5 真实性(Veracity) 6__eol__1.3 大数据对社会的影响 6__eol__1.3.1 大数据促进经济发展 6__eol__1.3.2 大数据提升社会保障 7__eol__1.3.3 数据治国 8__eol__1.4 大数据的分析方法 9__eol__1.4.1 统计 9__eol__1.4.2 数据挖掘 10__eol__1.4.3 人工智能 11__eol__1.5 数据可视化技术 11__eol__1.5.1 可视化历史 11__eol__1.5.2 可视化概述 12__eol__1.5.3 可视化应用 15__eol__第2章 数据预处理 17__eol__2.1 什么是网络爬虫 17__eol__2.2 网络爬虫的实现 18__eol__2.2.1 Python编程语言 18__eol__2.2.2 正则表达式 19__eol__2.2.3 超文本标记语言 21__eol__2.2.4 超文本传输协议 23__eol__2.3 数据清洗 24__eol__2.3.1 处理缺失值 24__eol____eol__2.3.2 处理异常值 25__eol__2.3.3 处理噪声 26__eol__第3章 基础统计分析 29__eol__3.1 统计学的基本概念 29__eol__3.2 连续变量的统计描述 30__eol__3.2.1 频数 30__eol__3.2.2 集中趋势描述指标 32__eol__3.2.3 离散趋势描述指标 33__eol__3.3 分类变量的统计描述 33__eol__3.4 常用统计图 34__eol__3.4.1 饼图 35__eol__3.4.2 柱状图 36__eol__3.4.3 散点图 38__eol__3.4.4 折线图 39__eol__3.5 统计分析应用示例 41__eol__3.5.1 人口变化总趋势 41__eol__3.5.2 人口结构变化 42__eol__3.5.3 二胎与生育率 43__eol__第4章 多维数据分析 45__eol__4.1 多维数据概述 45__eol__4.2 多维数据过滤分析 46__eol__4.3 相关性分析 50__eol__4.3.1 一般性相关性分析 50__eol__4.3.2 多维数据可视化相关性分析 51__eol__4.4 聚类分析 52__eol__4.5 降维分析 54__eol__4.5.1 主成分分析 54__eol__4.5.2 多维尺度变换 56__eol__4.5.3 T分布随机邻域嵌入 57__eol__4.6 多维特征提取 58__eol__4.6.1 雷达图 59__eol__4.6.2 用户画像 59__eol__4.6.3 Radviz特征提取 60__eol__4.7 多维数据分析应用示例 61__eol__4.7.1 郡县特征的关联度 61__eol__4.7.2 多维度分析得票率的关键因素 63__eol__第5章 时序数据分析 65__eol__5.1 时序数据概述 65__eol__5.2 多维时序数据呈现——折线 67__eol__5.3 多维时序数据呈现——柱状 69__eol__5.4 预测分析 72__eol__5.4.1 移动平均 72__eol__5.4.2 指数平滑 73__eol__5.4.3 三次指数平滑 74__eol__5.5 周期性检测 75__eol__5.6 时序分析应用示例 77__eol__5.6.1 美国各州新冠病毒肺炎确诊病例数的动态变化 77__eol__5.6.2 美国纽约州、加州疫情发展变化 79__eol__5.6.3 美国疫情总体态势 80__eol__5.6.4 美国疫情预测 81__eol__第6章 地理数据分析 83__eol__6.1 地理热度分析 83__eol__6.2 地理空间分析 86__eol__6.3 连接地图 87__eol__6.4 地理分析应用示例 88__eol__6.4.1 美国疫情确诊情况 88__eol__6.4.2 美国疫情死亡情况 90__eol__6.4.3 美国疫情传播分析 91__eol__6.4.4 宅在家里还是出门旅行 93__eol__第7章 图数据分析 95__eol__7.1 图数据概述 95__eol__7.2 树图 96__eol__7.3 图数据的量化可视化分析 98__eol__7.3.1 矩形树图 98__eol__7.3.2 旭日图 98__eol__7.4 图数据嵌套关系分析 99__eol__7.4.1 矩形堆积图 99__eol__7.4.2 圆堆积图 100__eol__7.5 图数据中的关联数据 101__eol__7.5.1 弧线图 101__eol__7.5.2 极坐标弧线图 101__eol__7.5.3 弦图 102__eol__7.5.4 冲积图 103__eol__7.6 力导向布局分析 104__eol__7.6.1 力导向设计思路 104__eol__7.6.2 力导向布局优点 104__eol__7.6.3 力导向布局缺点 105__eol__7.7 搜索算法 105__eol__7.7.1 广度优先搜索算法 106__eol__7.7.2 深度优先搜索算法 108__eol__7.8 最短路径算法 109__eol__7.9 图分析应用示例 109__eol__7.9.1 美国人口普查分区 110__eol__7.9.2 美国新冠病毒肺炎确诊病例按人口普查分区分布 110__eol__第8章 文本数据分析 115__eol__8.1 文本数据概述 115__eol__8.2 文本向量化 116__eol__8.2.1 词袋模型 116__eol__8.2.2 Word2Vec模型 116__eol__8.3 分词 118__eol__8.4 关键词提取 120__eol__8.5 知识图谱 121__eol__8.6 其他文本处理技术简介 122__eol__8.7 文本分析应用示例 124__eol__8.7.1 特朗普和拜登社交媒体回复——舆情分析 124__eol__8.7.2 特朗普和拜登在社交媒体上的宣传策略 125__eol__8.7.3 小结 127__eol__第9章 多媒体数据分析 129__eol__9.1 数字图像处理 129__eol__9.1.1 亮度调整 130__eol__9.1.2 直方图均衡化 132__eol__9.1.3 高斯平滑 133__eol__9.1.4 边缘检测 135__eol__9.2 数字音频处理 135__eol__9.3 数字视频处理 137__eol__9.4 多媒体分析应用示例 137__eol__第10章 综合应用示例:中国社会发展调研 139__eol__10.1 经济总体指标分析 139__eol__10.2 城镇化发展分析 142__eol__10.3 国际影响力分析 145__eol__10.4 科技发展分析 147__eol__10.5 教育发展分析 149__eol__10.6 文化发展分析 151__eol__10.7 医疗卫生发展分析 153__eol__10.8 环境治理状况分析 154__eol__10.9 居民收入变化分析 156__eol__参考资料 __eol__