注册 登录 进入教材巡展
#
  • #
  • #

出版时间:2019-12

出版社:高等教育出版社

以下为《大数据建模方法》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 高等教育出版社
  • 9787040530490
  • 1版
  • 296214
  • 44258377-9
  • 平装
  • 16开
  • 2019-12
  • 280
  • 276
  • 理学
  • 数学
  • 数据科学与大数据技术、统计学类
  • 本科
作者简介

张平文,北京大学数学科学学院教授,中国科学院院士,发展中国家科学院院士,教育部长江特聘教授,杰出青年基金获得者。现任北京大学副校长、大数据分析与应用技术国家工程实验室主任、北京大学大数据科学研究中心主任、中国工业与应用数学学会理事长。先后获得国家自然科学二等奖、教育部自然科学一等奖等奖励,并受邀在国际数学家大会、国际工业与应用数学大会及美国工业与应用数学学会年会等国际学术会议上做报告。担任国内外多家知名学术期刊的编委,发表学术论文百余篇。

戴文渊,第四范式(北京)技术有限公司创始人、首席执行官, 2005年国际大学生程序设计竞赛世界冠军,所发表的论文Boosting for Transfer Learning在迁移学习领域论文引用数排名世界第三,学术论文多次被国际顶级学术会议收录。百度最早的AI系统“凤巢”机器学习系统的设计者,第一位获得中国智能科学技术最高奖“吴文俊人工智能科学技术奖”一等奖的企业家,先后获得《麻省理工科技评论》《财富》及中国科学技术协会等评选的荣誉称号。

黄晶,资深大数据分析与挖掘专家,第四范式(北京)技术有限公司高级总监,在互联网和银行等多个领域的大数据应用上有着丰富的建模经验。曾任百度资深研发工程师,百度“凤巢”商业广告体系客户管理分析团队技术负责人,百度知心产品线的点击率预估等多个大数据和机器学习方向的技术负责人。

王新民,高级工程师、高级信息系统项目管理师、管理咨询师。曾在中央国家机关技术管理部门工作多年,现任大数据分析与应用技术国家工程实验室办公室副主任,在大数据分析、信息化建设、项目管理、政企合作等方面具有丰富的经验。参与多个国家重点研发计划项目并担任子课题负责人或项目骨干,主持或负责过多个大型信息化项目的建设工作,在国家级期刊上发表论文十余篇。

李昊辰北京邮电大学讲师,理学博士。研究领域主要包括偏微分方程数值解法、天气预报大数据方法等。在Hamilton系统保结构算法方向,对Schrödinger方程、Klein-Gordon方程、KP方程等系统的多辛格式和保能量格式的构造,以及平均向量场方法的B级数展开和其高阶方法的构造等进行研究;在天气预报大数据方法的研究上,利用机器学习和深度学习结合模式数据对北京地区和延庆站点温度进行预测,极大地提高了传统预测方法的精度。

查看全部
内容简介

本书包含理论和案例两部分内容, 理论部分从基础知识、指导思想、工作步骤及评估体系等角度对大数据建模的方法论进行了总结归纳, 案例部分介绍了该大数据建模方法论在气象、能源、网络、银行以及企业管理等多个领域中的实践及应用。大数据建模的特点使其不但需要有理论上的指导, 还需要在实践中落地, 因此本书非常强调理论与实践的并重。本书的主要读者是各高等院校大数据、数学、计算机等相关学科的高年级本科生和研究生,以及企事业单位中从事大数据相关科研与应用工作的技术人员等, 希望读者在阅读本书后,提高对大数据建模的认识和利用大数据建模来解决实际问题的能力。

目录

 前辅文
 I 理论
  1 基础知识
   1.1 模型与算法
    1.1.1 现实世界和机理
    1.1.2 模型
    1.1.3 算法
    1.1.4 模型与算法的区别及联系
   1.2 建模
    1.2.1 传统建模的步骤
    1.2.2 可计算建模
    1.2.3 建模思路的分类
    1.2.4 几种建模思路的对比
   1.3 大数据及其相关概念
    1.3.1 大数据
    1.3.2 计算能力
    1.3.3 人工智能
    1.3.4 几个概念之间的关系
    1.3.5 大数据概念出现的原因
   1.4 我国大数据建模的现状
    1.4.1 现状
    1.4.2 不同业界的态度
   1.5 小结
   参考文献
  2 数据思维
   2.1 什么是数据思维
    2.1.1 数据思维的由来
    2.1.2 数据思维的要素
   2.2 机器学习概述
    2.2.1 机器学习的分类
    2.2.2 机器学习的数学描述
   2.3 大数据建模的五个必要条件
   2.4 思考题
   参考文献
  3 大数据建模步骤
   3.1 从苹果和梨说起
   3.2 明确目标
   3.3 收集数据和样本定义
    3.3.1 样本定义和挑选
    3.3.2 样本定义案例
    3.3.3 数据准备
   3.4 提取特征
    3.4.1 特征工程的定义
    3.4.2 特征工程的重要性
    3.4.3 特征获取
    3.4.4 特征处理
    3.4.5 特征选择
    3.4.6 特征维度
    3.4.7 特征共线性问题
   3.5 模型训练
    3.5.1 随机梯度下降方法
    3.5.2 过拟合问题
   3.6 模型预测
   参考文献
  4 大数据建模的评估体系
   4.1 离线实验
    4.1.1 离线实验方法
    4.1.2 回归模型评估指标
    4.1.3 分类模型评估指标
   4.2 在线实验
    4.2.1 在线实验方法
    4.2.2 评估指标
   参考文献
  5 大数据平台
   5.1 大数据平台简介
   5.2 Python
    5.2.1 Python 简介
    5.2.2 Python 的安装
    5.2.3 实验数据集
    5.2.4 Python 的初步使用
   5.3 TensorFlow
    5.3.1 TensorFlow 简介
    5.3.2 TensorFlow 的安装
    5.3.3 TensorFlow 的初步使用
    5.3.4 基于TensorFlow 的机器学习
   5.4 第四范式先知平台
   5.5 小结
   参考文献
 II 案例
  6 天气预报
   6.1 天气的现象与探测
    6.1.1 大气的垂直结构
    6.1.2 大气的探测
    6.1.3 天气现象
   6.2 影响天气预报的几个关键因素
    6.2.1 云
    6.2.2 大气边界层
    6.2.3 辐射
   6.3 大气运动方程组
    6.3.1 大气运动的主要变量及其规律
    6.3.2 大气运动方程组
    6.3.3 其他坐标系下的运动方程组
   6.4 大气运动方程组的约简
    6.4.1 尺度分析法
    6.4.2 次网格参数化
   6.5 资料同化
    6.5.1 逐步订正法
    6.5.2 资料同化的改进方法
   6.6 小结
   参考文献
  7 精准气象服务
   7.1 背景介绍
    7.1.1 天气预报
    7.1.2 天气预报方法
    7.1.3 天气会商
   7.2 明确目标
    7.2.1 站点预报
    7.2.2 格点预报
    7.2.3 区域预报
    7.2.4 目标细化
   7.3 数据与样本
    7.3.1 实况数据
    7.3.2 模式数据
    7.3.3 模式初值
    7.3.4 本章所需的数据
   7.4 特征工程
    7.4.1 数据预处理
    7.4.2 站点预报的特征工程
    7.4.3 格点预报的特征工程
    7.4.4 区域预报的特征工程
    7.4.5 问题解决思路
    7.4.6 原始数据集
    7.4.7 数据合集
   7.5 模型构建与训练
    7.5.1 模型的构建
    7.5.2 模型的训练
   7.6 模型预测与评估
    7.6.1 评估标准
    7.6.2 不同模型对结果的订正
    7.6.3 四种模型的比较
    7.6.4 结论
   7.7 补充说明
   7.8 思考题
   参考文献
  8 风电功率预测
   8.1 背景介绍
   8.2 明确目标
   8.3 数据与样本
   8.4 特征工程
    8.4.1 风速计算数据的处理
    8.4.2 风机实测数据的处理
    8.4.3 特征可视化分析
    8.4.4 衍生特征
   8.5 模型构建与训练
    8.5.1 风速预测模型的构建
    8.5.2 功率预测模型的构建
    8.5.3 模型的训练
   8.6 模型预测与评估
    8.6.1 风速预测模型的预测与评估
    8.6.2 功率预测模型的预测与评估
   8.7 补充说明
   8.8 思考题
   参考文献
  9 广告点击率预估
   9.1 背景介绍
   9.2 明确目标
   9.3 数据和样本
   9.4 特征工程
    9.4.1 离散化
    9.4.2 特征组合
   9.5 模型构建与训练
    9.5.1 logistic 回归算法
    9.5.2 模型训练
   9.6 模型预测与评估
    9.6.1 离线评估
    9.6.2 在线评估
   参考文献
  10 银行理财推荐
   10.1 背景介绍
   10.2 明确目标
   10.3 数据和样本
    10.3.1 样本定义方式
    10.3.2 数据需求
   10.4 特征工程
   10.5 模型构建与训练
    10.5.1 logistic 算法
    10.5.2 GBDT 算法
   10.6 模型预测与评估
   参考文献
  11 企业经营管理
   11.1 背景介绍
   11.2 明确目标
   11.3 数据与样本
   11.4 特征工程
    11.4.1 建立基础指标库
    11.4.2 基础指标属性分析
    11.4.3 历史数据提取
    11.4.4 无量纲化处理
   11.5 模型构建
    11.5.1 建立指标体系
    11.5.2 构建指数模型
   11.6 模型预测与评估
    11.6.1 非负矩阵分解法
    11.6.2 模型效果评估
    11.6.3 模型预测
   11.7 补充说明
   参考文献

Baidu
map