- 电子工业出版社
- 9787121454196
- 1-1
- 525075
- 66254987-2
- 平塑
- 16开
- 2023-11
- 212
- 程序设计
- 高职
内容简介
本书围绕大数据预处理业务背景及相关技术,以学习情境的方式,首先介绍了使用 Python、Pandas对各种数据源的读写,然后介绍了数据的清洗、集成、规约、变换四个处理数据方式,最后介绍了使用Kettle工具和MapReduce编程对数据进行处理的技术,通过理论结合实际、循序渐进的学习方式,让读者学习并掌握大数据预处理技术及应用。__eol__本书理论分析相对较少,侧重动手实践,适合应用型本科、高职高专大数据技术专业学生和希望快速进入大数据领域的读者参考使用。__eol__
目录
导 言__eol__单元1 数据读写__eol__学习情境1 使用Python读写职业能力大数据分析平台【岗位】数据__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__学习情境2 使用Pandas读写职业能力大数据分析平台【技能】数据__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__单元2 数据清洗__eol__学习情境3 使用正则表达式从网页中提取招聘联系人的邮箱地址__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__学习情境4 使用Pandas对职业能力大数据分析平台【工资】表进行清洗__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__单元3 数据集成__eol__学习情境5 使用Pandas实现对职业能力大数据分析平台多个学生信息__eol__ 数据源进行集成__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__单元4 数据规约__eol__学习情境6 使用NumPy+Pandas实现对工资数据进行数量规约__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__单元5 数据变换__eol__学习情境7 使用Pandas+Sklearn对学生成绩实现数据规范化__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__单元6 Kettle工具使用__eol__学习情境8 使用ETL工具Kettle对职业能力大数据分析平台学生信息__eol__ 数据进行清洗__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__单元7 MapReduce数据处理__eol__学习情境9 使用MapReduce合并职业能力大数据分析平台【技能】数据__eol__学习情境描述__eol__学习目标__eol__任务书__eol__获取信息__eol__工作计划__eol__进行决策__eol__知识准备__eol__相关案例__eol__工作实施__eol__评价反馈__eol__拓展思考__eol__参考文献__eol__