华科专升本计算机系统结构-作业全
- 格式:doc
- 大小:194.00 KB
- 文档页数:10
第一章作业
简答题
1、简述什么是计算机系统结构。
2、答:计算机系统结构是程序员所看到的计算机属性,即概念性结构与功能性结构。
3、
4、计算机系统的层次从下到上包括哪些?
5、答:计算机系统的层次从上到下包括微程序机器级、机器语言、操作系统虚拟机、汇编
语言虚拟机、高级语言虚拟机、应用语言虚拟机。
6、
7、Flynn分类法是以什么对计算机系统进行分类分成哪几类?
8、答:Flynn分类法是以指令流和数据流的多倍性对计算机系统进行分类。Flynn分类法
把计算机系统的结构分为以下4类:单指令流单数据流、单指令多数据流、多指令流单数据流、多指令流多数据流。
9、
10、简述Amdahl定律及加速比计算公式。
答:Amdahl定律指出加快某部件执行速度所能获取得系统性加速比,受限于该部件的执行时间占系统中总执行时间的百分比。
加速比计算公式=系统性能(改进后)/系统性能(改进前)=总执行时间(改进前)/总执行时间(改进后)
计算题
5、如果某一些计算任务用向量方式求解比用标量方式求解快20倍。为达到加速比2,可用向量方式求解所花费时间占总的时间的百分比为多少
解:由题可知,系统加速比=2,部件加速比=20,通过向量方式求解可改进比例未知,可设为X。
根据Amdahl定律可知
系统加速比=1/[(1-X)+X/20]=2
求解得X=10/19
由此可得,可用向量方式求解所花费时间占总的时间的百分比魏53%
第二章作业
1、简述指令集结构设计的基本原则。
完整性、规整性、高效性和兼容性
2、简述RISC结构的设计原则。
1)选取使用频率最高的指令,并补充一些最有用的指令;
2)每条指令的功能应尽可能简单,并在一个机器周期内完成;
3)所有指令长度均相同;
4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行;
5)以简单有效的方式支持高级语言。
3
I5 I10
(1)采用最优Huffman编码法,计算这10条指令的操作码最短平均长度。
(2)采用Huffman编码法,计算这10条指令的操作码平均码长,信息冗余量。
1)操作码最短平均长度=
2)信息冗余量=%
第三章作业
1、当流水线中各个流水段的执行时间不完全相等时,流水线的最大吞吐率与实际吞吐率主要是由流水线中执行时间最长的那个流水段来决定的,这个流水段就成了整个流水线的“瓶颈”。解决流水线“瓶颈”问题的方法主要有哪两种
答:细分瓶颈段与重复设置瓶颈段两种方法。
2一条线性静态多功能流水线由6个功能段组成,加法操作使用其中的1,2,3,6功能段,乘法操作使用其中的1,4,5,6功能段,每个功能段的延迟时间均相等。流水线的输出端与输入端之间有直接数据通路,而且设有足够的缓冲及寄存器。用这条流水线计算
∑=⨯
=
6
1
i
i i
B A
F。
(1)画出流水线时空图;
(2)计算流水线的实际吞吐率,加速比和效率。
解:为了避免流水线的“先写后读”相关,使流水线完成计算的时间尽可能短,采用下述方法计算F:
(a1xb1+a2xb2)+(a3xb3+a4xb4)+(a5xb5+a6xb6)
按先乘后加、先括号内后括号外的有限次序,上述计算F的过程需要先做6次乘法,用1~6表示;再做3个括号内的3次加法,用7~9表示;最后做括号外的2次加法,用10~11表示。
流水线时空图如下:
由时空图可得实际吞吐率为:
TP=11/22∆t=∆t
加速比为:
S=T0/T k =(6x4∆t+5x4∆t)/22∆t=2
效率比:
E=(4x11∆t)/(6x224x11∆t)≈
3、一条由4个功能段组成的非线性流水线的预约表如下,每个功能段的延迟时间都为10ns
-9
(1) 写出流水线的禁止向量和初始冲突向量; (2) 画出状态图;
(3) 求流水线的最小启动循环和最小平均启动距离。
1)禁止向量F=(5,2,1),冲突向量C=(10011) 2)
3)最小启动循环为(3),最小平均启动距离为3.
第4章作业
Cray 1向量处理机,V 为向量寄存器,向量长度均为32;s 为标量寄存器。所用浮点功能执行部件的执行时间为:从存储器读数6拍,加法6拍,相乘7拍,求倒数近似值14拍,启动、输出延迟各1拍。分析下列向量指令组中,哪些指令可以链接,哪些指令可以并行,并计算不同指令各指令组全部完成所需的拍数。
(1) V0←存储器 (2) V2←V0*V1 V1←V2+V3 V3←存储器 V4←V5*V6 V4←V2+V3 (3) V0←存储器 (4) V0←存储器
V3←V1+V2 V1←1/V0 V4←V0*V3 V3←V1+V2
V6←V4+V5 V5←V3*V4 解:
1)V0←存储器
2) V1←V2+V3 并行 3) V4←V5*V6
i=4
i=3 加
总拍数=40(并行执行,以最长指令为准)
4)V2←V0*V1
并行 5) V3←存储器
6) V4←V2+V3 串行
总拍数=79(第3条错过时机,不能链接)
3)V0←存储器 并行
V3←V1+V2 链接 V4←V0*V3 V6←V4+V5 串行
4)V0←存储器 链接
V1←1/V0 链接 V3←V1+V2
V5←V3*V4 链接
9 31 乘访存 加
8 31