注意:此页面搜索的是所有试题
湖南大学-自算计体系结构
五、假设某程序各种分支指令数占所有指令数的百分比如下:
条件分支 20%(其中的60%是分支成功的)
跳转和调用 5%
现有一条段数为4的流水线,无条件分支在第2个时钟周期结束时就被解析出来,而条件分支要到第3个时钟周期结束时才能够被解析出来。第一个流水段是完全独立于指令类型的,即所有类型的指令都必须经过第一个流水段的处理。请问在没有任何控制相关的情况下,该流水线相对于存在上述控制相关情况下的加速比是多少?
六、假设有一条长流水线,仅仅对条件分支指令使用分支目标缓冲。其中分支预测错误的开销为4个时钟周期,分支目标缓冲不命中的开销为3个时钟周期。分支目标缓冲命中率为90%,预测正确率为90%,分支指令占所有指令的比例为15%,没有分支的基本CPI为1。 (1)求程序执行的CPI。 (2)相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序执行速度更快?
七、(10分)设指令流水线由取指令、分析指令和执行指令3个部件构成,每个部件经过的时间为△t,连续流入12条指令,假设没有停顿。请分别画出标量流水处理机以及ILP均为4的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们相对于标量流水处理机的加速比。
一、(5分)计算机系统设计中经常使用的4个定量原理是什么?请简要说明它们的含义。
二、假设某应用程序中有4类操作,通过改进各类操作的功能部件,可获得不同的性能提高。具体数据如下表所示: 操作类型 程序中的数量 (百万条指令) 改进前的执行时间 (周期) 改进后的执行时间 (周期) 操作1 10 2 1 操作2 30 20 15 操作3 35 10 3 操作4 15 4 1 (1)改进后,各类操作的加速比分别是多少? (2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少?
三、请简述指令之间数据冲突的类型。
五、下面一段MIPS汇编程序是计算高斯消去法中的关键一步,用于完成下面公式的计算: Y = a X + Y 其浮点指令延迟如下表所示: 整数指令均为1个时钟周期完成,浮点和整数部件均采用流水。整数操作之间以及与其它所有浮点操作之间的延迟为0,转移指令的延迟为0。 X中的最后一个元素存放在存储器中的地址为DONE。 FOO: L.D F2, 0(R1) MUT.D F4, F2, F0 L.D F6, 0(R2) ADD.D F6, F4, F6 S.D F6, 0[R2] DADDIU R1, R1, #8 DADDIU R2, R2, #8 DSUBIU R3, R1, #DONE BNEZ R3, FOO (1)对于标准的MIPS单流水线,上述循环计算一个Y值需要多少时间?其中有多少空转周期? (2)对于标准的MIPS单流水线,将上述循环顺序展开4次,不进行任何指令调度,计算一个Y值平均需要多少时间?加速比是多少?其加速是如何获得的? (3)对于标准的MIPS单流水线,将上述循环顺序展开4次,优化和调度指令,使循环处理时间达到最优,计算一个Y值平均需要多少时间?加速比是多少?
六、(5分)写出三级Cache的平均访问时间的公式。
七、(10分)高速缓存(Cache)是现代计算机存储系统重要的层次之一。假设一个2GHz,32位的处理器有32KB的直接映射L1 Cache和256KB的2路组相联L2 Cache。各级Cache都采用32B的块大小。(1)请说明对于L1和L2 Cache而言,32位的地址中标记(tag),索引(index)和偏移(offset)字段分别是多少位;(2)假设L1 Cache命中需要2个时钟周期完成访问操作,命中率为80%。L2 Cache命中需要10个时钟周期,命中率99%。若L2 Cache缺失,则需100个时钟周期从内存获取数据。请计算该机器存储系统平均访问时间。
八、给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论?
九、)在有Cache的计算机系统中,当I/O设备与主存直接交换数据时,可能会产生哪些数据不一致问题?如何解决?
(5分)请简述多处理机的Cache一致性问题,并简要说明解决多处理机Cache一致性问题的监听协议和目录协议的工作原理。
十一、(5分)通道有哪几种?请比较这几种通道的优缺点及适用场合。
(5分)请比较可用于动态互连网络的总线、交叉开关和多级开关的硬件复杂度和带宽。
六、假设有一条长流水线,仅仅对条件分支指令使用分支目标缓冲。其中分支预测错误的开销为4个时钟周期,分支目标缓冲不命中的开销为3个时钟周期。分支目标缓冲命中率为90%,预测正确率为90%,分支指令占所有指令的比例为15%,没有分支的基本CPI为1。 (1)求程序执行的CPI。 (2)相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序执行速度更快?
七、(10分)设指令流水线由取指令、分析指令和执行指令3个部件构成,每个部件经过的时间为△t,连续流入12条指令,假设没有停顿。请分别画出标量流水处理机以及ILP均为4的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们相对于标量流水处理机的加速比。
一、(5分)计算机系统设计中经常使用的4个定量原理是什么?请简要说明它们的含义。
二、假设某应用程序中有4类操作,通过改进各类操作的功能部件,可获得不同的性能提高。具体数据如下表所示: 操作类型 程序中的数量 (百万条指令) 改进前的执行时间 (周期) 改进后的执行时间 (周期) 操作1 10 2 1 操作2 30 20 15 操作3 35 10 3 操作4 15 4 1 (1)改进后,各类操作的加速比分别是多少? (2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少?
三、请简述指令之间数据冲突的类型。
五、下面一段MIPS汇编程序是计算高斯消去法中的关键一步,用于完成下面公式的计算: Y = a X + Y 其浮点指令延迟如下表所示: 整数指令均为1个时钟周期完成,浮点和整数部件均采用流水。整数操作之间以及与其它所有浮点操作之间的延迟为0,转移指令的延迟为0。 X中的最后一个元素存放在存储器中的地址为DONE。 FOO: L.D F2, 0(R1) MUT.D F4, F2, F0 L.D F6, 0(R2) ADD.D F6, F4, F6 S.D F6, 0[R2] DADDIU R1, R1, #8 DADDIU R2, R2, #8 DSUBIU R3, R1, #DONE BNEZ R3, FOO (1)对于标准的MIPS单流水线,上述循环计算一个Y值需要多少时间?其中有多少空转周期? (2)对于标准的MIPS单流水线,将上述循环顺序展开4次,不进行任何指令调度,计算一个Y值平均需要多少时间?加速比是多少?其加速是如何获得的? (3)对于标准的MIPS单流水线,将上述循环顺序展开4次,优化和调度指令,使循环处理时间达到最优,计算一个Y值平均需要多少时间?加速比是多少?
六、(5分)写出三级Cache的平均访问时间的公式。
七、(10分)高速缓存(Cache)是现代计算机存储系统重要的层次之一。假设一个2GHz,32位的处理器有32KB的直接映射L1 Cache和256KB的2路组相联L2 Cache。各级Cache都采用32B的块大小。(1)请说明对于L1和L2 Cache而言,32位的地址中标记(tag),索引(index)和偏移(offset)字段分别是多少位;(2)假设L1 Cache命中需要2个时钟周期完成访问操作,命中率为80%。L2 Cache命中需要10个时钟周期,命中率99%。若L2 Cache缺失,则需100个时钟周期从内存获取数据。请计算该机器存储系统平均访问时间。
八、给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论?
九、)在有Cache的计算机系统中,当I/O设备与主存直接交换数据时,可能会产生哪些数据不一致问题?如何解决?
(5分)请简述多处理机的Cache一致性问题,并简要说明解决多处理机Cache一致性问题的监听协议和目录协议的工作原理。
十一、(5分)通道有哪几种?请比较这几种通道的优缺点及适用场合。
(5分)请比较可用于动态互连网络的总线、交叉开关和多级开关的硬件复杂度和带宽。