注册 登录 进入教材巡展
#
  • #

出版时间:2018-09

出版社:机械工业出版社

以下为《异构系统体系结构:原理、模型及应用》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111606697
  • 1-1
  • 227174
  • 49239386-3
  • 平装
  • 16开
  • 2018-09
  • 150
  • 160
  • 工学
  • 计算机科学与技术
  • TP303
  • 计算机科学与技术
  • 本科
作者简介
胡文美(Wen-mei W. Hwu) MulticoreWare公司联合创始人兼CTO,现任美国伊利诺伊大学厄巴纳-香槟分校(UIUC)电气与计算机工程系教授,兼任并行计算研究中心(Microsoft和Intel联合资助)首席科学家,以及全球首家CUDA卓越中心(NVIDIA资助)首席研究员。胡教授是IEEE和ACM会士,在编译器设计、计算机体系结构、微体系结构和并行计算方面贡献卓著。 ---译者简介--- 方娟 北京工业大学计算机学院教授,计算机系统结构系主任。长期从事计算机体系结构领域的教学和科研工作,近年来致力于异构多核体系结构的研究。
查看全部
内容简介
本书为我们呈现了异构系统架构(HSA)的关键技术、实现方法和案例应用。首先回顾异构并行处理的发展进程、相关问题,分析HSA相对于其他技术的优势。之后深入探讨了运行时、内存模型、队列、上下文交换、架构队列语言、模拟器、工具链等问题。最后选取三个实际案例,基于C++应用程序,说明了HSA如何能够显著提升程序性能。
目录
出版者的话译者序推荐序前言作者简介第1章 引言 1第2章 HSA 概述 52.1 GPU计算简史:HSA解决的问题 52.2 HSA的支柱 92.2.1 HSA内存模型 92.2.2 HSA排队模型 92.2.3 HSAIL虚拟ISA 102.2.4 HSA上下文切换 102.3 HSA规范 102.3.1 HSA平台系统体系结构规范 102.3.2 HSA运行时规范 102.3.3 HSA程序员参考手册—HSAIL SPEC 112.4 HSA软件 112.5 HSA基金会 122.6 小结 13第3章 HSAIL——虚拟并行ISA 143.1 引言 143.2 编译流程示例 153.3 HSAIL执行模型 163.4 HSAIL指令集简介 173.4.1 原子操作 183.4.2 寄存器 183.4.3 分段 193.4.4 波前和通道 203.5 HSAIL机器模型和配置文件 213.6 HSAIL编译流程 223.7 HSAIL编译工具 233.7.1 编译器框架 233.7.2 CL离线编译 243.7.3 HSAIL汇编器/反汇编器 253.7.4 ISA和机器码汇编器/反汇编器 253.8 小结 25第4章 HSA运行时 264.1 引言 264.2 HSA核心运行时API 284.2.1 运行时的初始化和关闭 284.2.2 运行时的通知 294.2.3 系统和HSA代理信息 294.2.4 信号 304.2.5 队列 314.2.6 体系结构排队语言 314.2.7 内存 324.2.8 代码对象和可执行文件 344.3 HSA运行时扩展 354.3.1 HSAIL 终止化 354.3.2 图像和采样器 354.4 小结 37参考文献 38第5章 HSA 内存模型 395.1 引言 395.2 HSA内存结构 405.2.1 分段 415.2.2 平面寻址 425.2.3 共享虚拟寻址 425.2.4 所有权 435.2.5 图像内存 435.3 HSA内存一致性基础 435.3.1 背景:顺序一致性 445.3.2 背景:冲突和竞争 455.3.3 单一内存范围的HSA内存模型 455.3.4 多个内存范围的HSA内存模型 485.3.5 内存段 515.3.6 汇总:HSA竞争自由 515.3.7 附加观察和注意事项 525.4 HSA内存模型中的高级一致性 525.4.1 松弛原子 525.4.2 所有权和范围界限 545.5 小结 54参考文献 55第6章 HSA 排队模型 566.1 引言 566.2 用户模式队列 566.3 体系结构排队语言 596.3.1 包的类型 606.3.2 创建数据包 636.4 包的提交与调度 646.5 小结 70参考文献 70第7章 编译器技术 717.1 引言 717.2 C++ AMP简介 717.2.1 C++ AMP array_view 737.2.2 C++ AMP parallel_for_each或内核调用 737.3 将HSA作为编译器目标 747.4 将关键的C++ AMP构造映射到HSA 757.5 C++ AMP编译流程 777.6 编译生成的C++ AMP代码 787.7 C++ AMP中平铺的编译器支持 807.7.1 划分计算域 817.7.2 指定地址空间和屏障 817.8 内存段注释 827.9 针对HSA的通用C++ 847.10 平台原子的编译器支持 867.11 新建/删除操作符的编译器支持 917.11.1 实现具有平台原子性的新建/删除操作符 927.11.2 将新建/删除返回的地址提升到全局内存段 947.11.3 基于等待 API /信号HSAIL指令改进新建/删除操作符 947.12 小结 96参考文献 96第8章 应用用例:平台原子性 978.1 引言 978.2 HSA中的原子性 988.3 任务队列系统 1008.3.1 静态执行 1008.3.2 动态执行 1018.3.3 HSA任务队列系统 1018.3.4 评估 1048.4 广度优先搜索 1078.4.1 传统实现 1098.4.2 HSA实现 1108.4.3 评估 1128.5 数据布局转换 1138.5.1 使用PTTWAC算法进行SoA-ASTA转换 1158.5.2 PTTWAC的HSA实现 1168.5.3 评估 1168.6 小结 118致谢 118参考文献 118第9章 HSA模拟器 1209.1 在Multi2Sim中模拟HSA 1209.1.1 引言 1209.1.2 Multi2Sim-HSA 1219.1.3 HSAIL 宿主机 HSA 1229.1.4 HSA 运行时 1249.1.5 仿真器设计 1249.1.6 日志与调试 1259.1.7 Mulit2Sim-HSA路线图 1269.1.8 安装与支持 1269.2 HSAemu仿真HSA 1279.2.1 引言 1279.2.2 建模的HSA组件 1289.2.3 HSAemu的设计 1299.2.4 多线程HSA GPU仿真器 1319.2.5 剖析、调试与性能模型 1329.3 softHSA模拟器 1339.3.1 引言 1339.3.2 高层次设计 1339.3.3 创建与测试模拟器 1349.3.4 使用LLVM HSA模拟器进行调试 135参考文献 137索引 139
Baidu
map