目录 第1章计算机体系结构导论/1 1.1计算机体系结构及其系列概念1 1.1.1影响计算机(硬件)性能的根本因素1 1.1.2广义计算机语言与虚拟计算机2 1.1.3计算机体系结构及其范畴4 1.1.4计算机组成与计算机实现6 1.1.5软件移植与软件兼容7 1.1.6计算机体系结构的特性10 1.2计算机体系结构的改进和演变11 1.2.1计算模型及其数据驱动原理11 1.2.2计算机体系结构原型及其改进13 1.2.3计算机体系结构演变的影响因素15 1.2.4计算机体系结构的演变17 1.3计算机体系结构的并行性及其发展19 1.3.1并行计算机与并行性19 1.3.2并行性实现等级划分21 1.3.3提高计算机并行性的技术途径22 1.3.4多处理机与多计算机23 1.3.5计算机实现并行处理的历程24 1.3.6计算机体系结构分类26 1.4计算机体系结构设计基础28 1.4.1体系结构设计的原理准则29 1.4.2体系结构设计的策略途径31 1.4.3体系结构设计的量化分析32 1.4.4计算机评价及其量化计算33 1.4.5基准测试程序及其测试统计35 复习题39 练习题40计算机体系结构目录第2章计算机体系结构属性优选/44 2.1数据表示及其表示格式44 2.1.1数据表示及其选取原则44 2.1.2标志符数据表示47 2.1.3描述符数据表示50 2.1.4浮点数尾数基值与格式参数51 2.1.5原子类型数据字位数54 2.2指令系统功能配置及其支持55 2.2.1指令系统构建的基本原则56 2.2.2指令系统功能配置分类57 2.2.3复杂指令系统功能配置及其特点59 2.2.4精简指令系统功能配置及其特点60 2.2.5RISC实现的关键技术61 2.3指令字格式及其优化设计64 2.3.1指令字格式优化的目标与策略65 2.3.2CPU存储特性及其分类66 2.3.3指令字长度结构及其分类67 2.3.4地址码长度的缩短70 2.3.5操作码的编码71 2.3.6控制指令字中有关信息的表示75 2.4存储部件的结构配置79 2.4.1存储部件的编址79 2.4.2主存储器的数据存放81 2.4.3操作数寻址83 2.4.4程序定位85 2.4.5主存储器保护87 2.5输入输出与系统总线的结构配置89 2.5.1输入输出的操作控制89 2.5.2中断实现功能的软硬件分配91 2.5.3系统总线的定时与仲裁94 复习题97 练习题100 第3章信息加工的流水线技术/104 3.1流水线及其特点与分类104 3.1.1指令序列处理及其流水线概念104 3.1.2流水线的表示106 3.1.3流水线的分类108 3.1.4流水线的特点111 3.2流水线处理机的实现结构112 3.2.1重叠处理的实现结构及其访问冲突113 3.2.2先行控制及其实现结构114 3.2.3不同级别的流水线结构117 3.2.4流水线结构中存在的问题118 3.3线性流水线性能及其最佳段数选取119 3.3.1线性流水线的性能指标119 3.3.2流水线最佳段数的选取123 3.3.3流水线瓶颈段的处置124 3.3.4条件转移对流水线效率的影响125 3.4指令流水线相关及其处理129 3.4.1流水线相关及其分类与处理策略129 3.4.2资源相关及其处理131 3.4.3操作数相关及其处理133 3.4.4变址相关及其处理137 3.4.5条件转移相关及其处理137 3.4.6中断转移相关及其处理145 3.5非线性流水线的任务调度147 3.5.1任务调度及其时间间隔147 3.5.2任务调度属性及其生成150 3.5.3最小启动循环调度策略的生成与实现152 3.5.4非线性流水线的优化调度154 3.5.5多功能非线性流水线的调度156 复习题159 练习题160 第4章信息存储的层次与并行技术/166 4.1存储系统及其存储层次技术166 4.1.1存储系统及其组织原理166 4.1.2存储系统的性能指标169 4.1.3三层二级存储系统170 4.1.4Cache存储体系概述173 4.2并行存储器及其并行访问技术177 4.2.1并行存储器及其带宽扩展177 4.2.2双端口存储器178 4.2.3相联存储器179 4.2.4单体多字存储器182 4.2.5多体多字存储器183 4.3Cache存储体系功能操作的实现189 4.3.1物理地址Cache的地址变换189 4.3.2虚拟地址Cache的地址变换198 4.3.3Cache块替换算法200 4.3.4Cache数据一致性及其维护203 4.4提高Cache存储体系性能的方法208 4.4.1Cache未命中的类型208 4.4.2降低Cache未命中率的方法209 4.4.3减少Cache未命中开销的方法215 4.4.4减少Cache命中时间的方法218 4.4.5提高Cache性能的方法比较219 复习题220 练习题222 第5章信息传输的互连网络技术/229 5.1系统域互连网络概述229 5.1.1互连网络及其属性229 5.1.2互连网络的组成231 5.1.3互连网络的描述方法232 5.1.4常用互连函数233 5.1.5互连网络的结构特性与传输性能参数238 5.2静态互连网络240 5.2.1静态互连网络及其选用要求240 5.2.2静态互连网络的结构特性241 5.2.3静态互连网络的结构特性比较244 5.3动态互连网络245 5.3.1动态互连网络与总线246 5.3.2交叉开关互连网络246 5.3.3多级交叉开关互连网络247 5.3.4动态互连网络性能比较250 5.4常用多级交叉开关互连网络251 5.4.1Ω多级交叉开关网络251 5.4.2STARAN多级交叉开关网络252 5.4.3间接方体多级交叉开关网络256 5.4.4δ多级交叉开关网络257 5.4.5DM多级交叉开关网络259 5.4.63级Clos交叉开关网络260 5.4.7Benes多级交叉开关网络262 5.5系统域互连网络消息传递265 5.5.1消息及其传递格式266 5.5.2消息包传递方式266 5.5.3路由选择与虚拟通道268 5.5.4路由选择算法及其分类270 5.5.5算术寻径算法270 5.5.6死锁及其解除和避免方法272 5.5.7流量控制及其控制策略277 5.5.8选播和广播路径选择279 复习题281 练习题283 第6章指令级高度并行处理机/288 6.1指令级高度并行及其静态指令调度288 6.1.1标量处理机及其指令级高度并行288 6.1.2指令发射与指令调度289 6.1.3软件静态指令调度290 6.2硬件动态指令调度293 6.2.1动态指令调度概述294 6.2.2CDC记分牌指令调度方法295 6.2.3Tomasulo指令调度方法301 6.3基于动态指令调度的多发射处理机307 6.3.1超标量处理机307 6.3.2超流水线处理机311 6.3.3超标量超流水线处理机313 6.3.44种流水线处理机的性能比较316 6.4基于静态指令调度的多发射处理机317 6.4.1超长指令字处理机及其结构原理318 6.4.2超长指令字处理与超标量处理的比较319 6.4.3超长指令字处理机实例——Cydra 5处理器320 复习题321 练习题322 第7章数据操作级高度并行处理机/325 7.1向量处理机325 7.1.1向量处理机与向量处理方式325 7.1.2向量处理机的指令集327 7.1.3向量处理机的组织结构330 7.1.4提高向量处理机性能的常用技术332 7.1.5向量处理机的性能参数336 7.1.6向量处理机实例338 7.2阵列处理机346 7.2.1阵列处理机及其体系结构346 7.2.2阵列处理机的特点与PE结构348 7.2.3阵列处理机并行算法举例349 7.2.4阵列处理机实例351 7.3脉动阵列处理机358 7.3.1脉动阵列处理机及其特点358 7.3.2特定脉动阵列处理机361 7.3.3通用脉动阵列处理机363 复习题364 练习题365 参考文献/369