数据科学技术与应用——基于Python实现(第2版)
¥39.00定价
作者: 宋晖
出版时间:2023-12
出版社:电子工业出版社
- 电子工业出版社
- 9787121415159
- 1-5
- 421595
- 48253460-9
- 平塑
- 16开
- 2023-12
- 313
- 196
- 工学
- 计算机科学与技术
- 计算机科学与技术
- 本科 研究生及以上
目录
目 录__eol__第1章 数据科学基础 (1)__eol__1.1 数据科学概述 (1)__eol__1.1.1 数据的力量 (1)__eol__1.1.2 数据科学的知识结构 (2)__eol__1.1.3 数据科学的工作流程 (4)__eol__1.2 数据科学的关键技术 (5)__eol__1.2.1 数据采集 (5)__eol__1.2.2 数据预处理 (7)__eol__1.2.3 数据存储与管理 (8)__eol__1.2.4 数据分析 (9)__eol__1.3 Python数据分析工具 (9)__eol__1.3.1 科学计算集成环境 (9)__eol__1.3.2 Python编译环境 (10)__eol__1.3.3 Jupyter Notebook (11)__eol__1.4 Python语言基础 (12)__eol__1.4.1 常用数据类型 (12)__eol__1.4.2 流程控制 (14)__eol__1.4.3 函数和方法库 (16)__eol__综合练习题 (17)__eol__第2章 多维数据结构与运算 (18)__eol__2.1 多维数组对象 (18)__eol__2.1.1 多维数组(张量) (18)__eol__2.1.2 一维数组对象 (19)__eol__2.1.3 二维数组对象 (21)__eol__2.1.4 创建多维数组的常用函数 (23)__eol__2.2 多维数组运算 (25)__eol__2.2.1 基本算术运算 (26)__eol__2.2.2 函数和矩阵运算 (27)__eol__2.2.3 随机数组生成函数 (29)__eol__2.3 案例:随机游走轨迹模拟 (30)__eol__综合练习题 (33)__eol__第3章 数据汇总与统计 (34)__eol__3.1 统计的基本概念 (34)__eol__3.1.1 统计的含义 (34)__eol__3.1.2 常用统计量 (35)__eol__3.2 pandas数据结构 (37)__eol__3.2.1 Series对象 (37)__eol__3.2.2 Series对象的数据访问 (38)__eol__3.2.3 DataFrame对象 (40)__eol__3.2.4 DataFrame对象的数据访问 (41)__eol__3.3 数据文件的读/写 (45)__eol__3.3.1 读/写CSV文件和TXT文件 (45)__eol__3.3.2 读取Excel文件 (48)__eol__3.4 数据清洗 (49)__eol__3.4.1 缺失数据处理 (49)__eol__3.4.2 去除重复数据 (52)__eol__3.5 数据规整化 (52)__eol__3.5.1 数据合并 (52)__eol__3.5.2 数据排序 (55)__eol__3.6 统计分析 (56)__eol__3.6.1 通用函数与运算 (57)__eol__3.6.2 统计函数 (57)__eol__3.6.3 相关性分析 (60)__eol__3.6.4 案例:问卷调查反馈表分析 (60)__eol__综合练习题 (63)__eol__第4章 数据可视化 (64)__eol__4.1 Python绘图基础 (64)__eol__4.1.1 认识基本图形 (64)__eol__4.1.2 pandas快速绘图 (64)__eol__4.1.3 Matplotlib精细绘图 (66)__eol__4.2 可视化数据探索 (71)__eol__4.2.1 绘制常用图形 (71)__eol__4.2.2 使用pyecharts绘制交互数据图 (81)__eol__综合练习题 (85)__eol__第5章 机器学习建模分析 (88)__eol__5.1 机器学习概述 (88)__eol__5.1.1 机器学习与人工智能 (88)__eol__5.1.2 Python机器学习方法库 (90)__eol__5.2 回归分析 (90)__eol__5.2.1 回归分析原理 (90)__eol__5.2.2 回归分析实现 (91)__eol__5.2.3 回归分析性能评估 (94)__eol__5.3 分类分析 (96)__eol__5.3.1 分类学习原理 (96)__eol__5.3.2 决策树 (98)__eol__5.3.3 支持向量机 (102)__eol__5.4 聚类分析 (106)__eol__5.4.1 聚类任务 (106)__eol__5.4.2 K-means算法 (107)__eol__5.4.3 聚类方法的性能评估 (110)__eol__5.5 数据降维 (112)__eol__5.5.1 降维分析方法 (112)__eol__5.5.2 主成分分析 (113)__eol__5.6 集成学习 (115)__eol__5.6.1 随机森林算法的基本原理 (116)__eol__5.6.2 梯度提升机算法的基本原理 (116)__eol__5.6.3 集成学习建模分析 (117)__eol__综合练习题 (119)__eol__第6章 神经网络与深度学习建模分析 (120)__eol__6.1 神经网络概述 (120)__eol__6.1.1 神经元与感知器 (120)__eol__6.1.2 神经网络模型 (121)__eol__6.1.3 神经网络分类实现 (122)__eol__6.2 深度学习 (125)__eol__6.2.1 深度学习的基本原理 (125)__eol__6.2.2 深度学习框架Keras (126)__eol__6.2.3 深度学习建模分析实例 (128)__eol__综合练习题 (130)__eol__第7章 文本数据处理 (131)__eol__7.1 文本处理概述 (131)__eol__7.1.1 文本处理的常见任务 (131)__eol__7.1.2 文本处理的基本步骤 (132)__eol__7.2 中文文本处理 (134)__eol__7.2.1 中文分词 (134)__eol__7.2.2 词性标注 (135)__eol__7.2.3 特征提取 (136)__eol__7.3 实例:垃圾邮件的识别 (140)__eol__7.3.1 数据来源 (140)__eol__7.3.2 基于词袋模型识别垃圾邮件 (141)__eol__7.3.3 基于词向量模型识别垃圾邮件 (143)__eol__综合练习题 (146)__eol__第8章 图像数据处理 (147)__eol__8.1 数字图像概述 (147)__eol__8.1.1 数字图像 (147)__eol__8.1.2 数字图像类型 (147)__eol__8.1.3 数字图像处理 (148)__eol__8.2 Python图像处理 (149)__eol__8.2.1 Python图像处理库 (149)__eol__8.2.2 图像的基本操作 (150)__eol__8.3 案例:深度学习实现图像分类 (152)__eol__8.3.1 卷积神经网络 (152)__eol__8.3.2 基于Keras实现图像分类 (153)__eol__综合练习题 (157)__eol__第9章 时序数据与语音处理 (158)__eol__9.1 时序数据概述 (158)__eol__9.1.1 时序数据特性 (158)__eol__9.1.2 时序数据特征的提取 (159)__eol__9.2 时序数据分析方法 (161)__eol__9.2.1 时序数据分析过程 (161)__eol__9.2.2 温度预测实例 (162)__eol__9.3 语音识别技术 (166)__eol__9.3.1 语音识别技术简介 (166)__eol__9.3.2 语音识别中的时序数据处理 (167)__eol__9.3.3 在线语音识别实例 (169)__eol__综合练习题 (171)__eol__第10章 大数据技术 (172)__eol__10.1 大数据概述 (172)__eol__10.1.1 大数据的特点 (172)__eol__10.1.2 大数据技术 (174)__eol__10.1.3 大数据基础设施 (175)__eol__10.2 分布式计算框架 (177)__eol__10.2.1 Hadoop概述 (178)__eol__10.2.2 MapReduce分布式计算 (180)__eol__10.2.3 Spark分布式计算 (182)__eol__10.2.4 Spark分布式计算 (183)__eol__10.3 分布式建模分析工具 (185)__eol__10.3.1 Hadoop Mahout (185)__eol__10.3.2 Spark MLlib (186)__eol__10.3.3 Spark MLlib建模分析 (187)__eol__综合练习题 (188)__eol__参考资料 (189)