计算机体系结构(第2版)
作者: 张晨曦
出版时间:2005-06-06
出版社:高等教育出版社
- 高等教育出版社
- 9787040166477
- 2
- 248266
- 平装
- 16开
- 2005-06-06
- 470
- 329
- 工学
- 计算机科学与技术
本书是普通高等教育“十五”国家级规划教材,第一版被列为“面向21世纪课程教材”,并于2002年获全国普通高等学校优秀教材二等奖。为了跟踪和反映计算机技术的发展,新版教材在第一版的基础上进行了较大的修改,补充了新内容,进一步提高了可读性和系统性。
本书除了着重论述体系结构的基本概念、基本原理、基本结构和基本分析方法以外,还强调采用量化的分析方法,使读者能更具体、实际地分析和设计计算机体系结构。
全书共7章:计算机体系结构的基本概念,计算机指令集结构设计,流水线技术,指令级并行,存储层次,输入/输出系统,多处理机。主要内容有:计算机体系结构的概念以及并行性概念的发展,DLX,流水线的基本概念和性能分析,流水线的相关问题,向量处理机,指令动态调度,超标量和超长指令字技术,分支处理技术,Cache的基本知识及提高性能的方法,廉价磁盘冗余阵列RAID,I/O系统性能分析,多处理机的存储器体系结构、互连网络、同步机制以及同时多线程技术等。全书比较全面地介绍了当今计算机体系结构的发展前沿,并配有大量的实例分析。
本书可作为高等学校计算机及相关专业本科生或研究生计算机体系结构课程的教材,也可供从事计算机事业的工程技术人员参考。
第1章 计算机体系结构的基本概念
1.1 引言
1.2 计算机体系结构的概念
1.2.1 计算机系统中的层次概念
1.2.2 计算机体系结构
1.2.3 计算机组织和计算机实现技术
1.3 计算机体系结构的发展
1.3.1 存储程序计算机体系结构及其发展
1.3.2 计算机的分代和分型
1.3.3 应用需求的发展
1.3.4 计算机实现技术的发展
1.3.5 技术的挑战和体系结构的生命周期
1.4 影响计算机体系结构的成本和价格因素
1.4.1 计算机系统的成本和价格
1.4.2 时间因素
1.4.3 集成电路的成本
1.5 定量分析技术基础
1.5.1 计算机性能的评测
1.5.2 测试程序
1.5.3 性能设计和评测的基本原则
1.5.4 CPU的性能
1.6 计算机体系结构中并行性的发展
1.6.1 并行性概念
1.6.2 提高并行性的技术途径
1.6.3 并行计算的应用需求
1.7 小结
习题1
第2章 计算机指令集结构设计
2.1 指令集结构的分类
2.1.1 指令集结构的分类
2.1.2 通用寄存器型指令集结构分类
2.2 寻址技术
2.3 指令集结构的功能设计
2.3.1 CISC指令集结构的功能设计
2.3.2 RISC指令集结构的功能设计
2.3.3 控制指令
2.4 操作数的类型、表示和大小
2.5 指令集格式的设计
2.5.1 寻址方式的表示方法
2.5.2 指令集格式的选择
2.6 DLX指令集结构
2.6.1 DLX指令集结构
2.6.2 DLX指令集结构效能分析
2.7 小结
习题2
第3章 流水线技术
3.1 流水线的基本概念
3.1.1 流水线的基本概念
3.1.2 流水线的分类
3.2 DLX的基本流水线
3.2.1 DLX的一种简单实现
3.2.2 基本的DLX流水线
3.2.3 流水线性能分析
3.3 流水线中的相关
3.3.1 流水线的结构相关
3.3.2 流水线的数据相关
3.3.3 流水线的控制相关
3.4 MIPS R4000流水线计算机简介
3.4.1 MIPS R4000整型流水线
3.4.2 MIPS R4000浮点流水线
3.5 向量处理机
3.5.1 向量处理方式和向量处理机
3.5.2 提高向量处理机性能的主要技术
3.5.3 向量处理机的性能评价
3.6 小结
习题3
第4章 指令级并行
4.1 指令级并行的概念
4.1.1 循环展开调度的基本方法
4.1.2 相关性
4.2 指令的动态调度
4.2.1 动态调度的原理
4.2.2 动态调度算法之一:记分牌
4.2.3 动态调度算法之二:Tomasulo算法
4.3 控制相关的动态解决技术
4.3.1 分支预测缓冲
4.3.2 分支目标缓冲
4.3.3 基于硬件的前瞻执行
4.4 多指令流出技术
4.4.1 静态超标量技术
4.4.2 动态多指令流出技术
4.4.3 超长指令字技术
4.4.4 多流出处理器受到的限制
4.5 小结
习题4
第5章 存储层次
5.1 存储器的层次结构
5.1.1 从单级存储器到多级存储器
5.1.2 存储层次的性能参数
5.1.3 “Cache-主存”和“主存-辅存”层次
5.1.4 存储层次的4个问题
5.2 Cache基本知识
5.2.1 映象规则
5.2.2 查找方法
5.2.3 替换算法
5.2.4 写策略
5.2.5 Cache的结构
5.2.6 Cache性能分析
5.2.7 改进Cache性能
5.3 降低Cache失效率的方法
5.3.1 增加Cache块大小
5.3.2 提高相联度
5.3.3 Victim Cache
5.3.4 伪相联Cache
5.3.5 硬件预取技术
5.3.6 由编译器控制的预取
5.3.7 编译器优化
5.4 减少Cache失效开销
5.4.1 让读失效优先于写
5.4.2 子块放置技术
5.4.3 请求字处理技术
5.4.4 非阻塞Cache技术
5.4.5 采用两级Cache
5.5 减少命中时间
5.5.1 容量小、结构简单的Cache
5.5.2 虚拟Cache
5.5.3 写操作流水化
5.5.4 Cache优化技术总结
5.6 主存
5.7 虚拟存储器
5.7.1 虚拟存储器基本原理
5.7.2 快表
5.8 进程保护和虚存实例
5.8.1 进程保护
5.8.2 页式虚存举例:Alpha AXP的存储管理和21064的TLB
5.9 Alpha AXP 21064存储层次
5.10 小结
习题5
第6章 输入/输出系统
6.1 引言
6.1.1 I/O系统性能与CPU性能
6.1.2 I/O系统的可靠性
6.2 外部存储设备
6.2.1 磁盘设备
6.2.2 Flash存储器
6.2.3 磁带设备
6.2.4 光盘设备
6.3 可靠性、可用性和可信性
6.4 廉价磁盘冗余阵列RAID
6.4.1 RAID0
6.4.2 RAID1
6.4.3 RAID2
6.4.4 RAID3
6.4.5 RAID4
6.4.6 RAID5
6.4.7 RAID6
6.4.8 RAID7
6.4.9 RAID的实现与发展
6.5 I/O设备与CPU和存储器的连接
6.5.1 总线
6.5.2 设备的连接
6.5.3 通道
6.6 I/O系统性能分析
6.6.1 I/O性能与系统响应时间
6.6.2 Little定律
6.6.3 M/M/1排队系统
6.6.4 M/M/m排队系统
6.7 I/O与操作系统
6.7.1 DMA和虚拟存储器
6.7.2 I/O和Cache数据一致性
6.7.3 异步I/O
6.7.4 块服务器和文件服务器
6.8 小结
习题6
第7章 多处理机
7.1 引言
7.1.1 并行计算机体系结构的分类
7.1.2 通信模型和存储器的结构模型
7.1.3 并行处理面临的挑战
7.2 对称式共享存储器体系结构
7.2.1 多处理机Cache一致性
7.2.2 实现一致性的基本方案
7.2.3 监听协议及其实现
7.3 分布式共享存储器体系结构
7.3.1 基于目录的Cache一致性
7.3.2 目录协议及其实现
7.4 互连网络
7.4.1 互连网络的性能参数
7.4.2 静态连接网络
7.4.3 动态连接网络
7.5 同步
7.5.1 基本硬件原语
7.5.2 用一致性实现锁
7.5.3 同步性能问题
7.5.4 大规模机器的同步
7.6 同时多线程
7.6.1 将线程级并行转换为指令级并行
7.6.2 同时多线程处理器的设计
7.6.3 同时多线程的性能
7.7 多处理机实例
7.8 小结
习题7
主要参考文献