A-A+
在一台向量处理机上实现A=B×S计算 其中A和B是长度为N=200的向量 S是一个标量。向量
问题详情
在一台向量处理机上实现A=B×S计算,其中A和B是长度为N=200的向量,S是一个标量。向量寄存器长度MVL=64,各功能部件的启动时间为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,执行标量代码的开销Tloop为15个时钟周期,对一个向量元素执行一次操作的时间Tg为1个时钟周期。求计算A的总执行时间。
请帮忙给出正确答案和分析,谢谢!
参考答案
正确答案:×
假设向量A和B存放在向量寄存器Ra和Rb中,标量S存放在标量寄存器R0中,由下面3条指令完成计算:LVV1,RaMULTSVV2,R0,V1SVV2,Rb这3条指令之间存在相关,需分为3个编队m=3。向量需要分为[200/64]=4组进行计算。由题目得Tstart=12+12+7=31Tloop=15T=4×(Tloop+Tstart)+3×200×1=4×(15+31)+3×200×1=784