发明名称 面向可重构阵列的多参数融合性能建模方法
摘要 本发明公开了一种面向可重构阵列的多参数融合性能建模方法,该建模方法将一个任务分解成一系列连续的阵列操作p=[1,P],则任务总体执行时间等于多次阵列操作的重构周期数,数据载入周期数,阵列计算周期数以及数据存储周期数的总和再乘以阵列工作频率,即:<img file="DDA00003130773300011.GIF" wi="934" he="138" />其中,TET表示任务的总体执行时间,f表示阵列工作的频率,其中CFC表示重构周期,LDC表示数据载入周期,CPC表示阵列计算周期,STC表示数据存储周期。本发明能够精确地、完善地把可重构处理器的总体执行时间解析的表达出来,以此总体执行时间的性能模型,为用户的算法映射提供了评估和指导意义。
申请公布号 CN103218347B 申请公布日期 2016.01.20
申请号 CN201310156766.4 申请日期 2013.04.28
申请人 清华大学 发明人 尹首一;刘大江;刘雷波;魏少军
分类号 G06F15/80(2006.01)I 主分类号 G06F15/80(2006.01)I
代理机构 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人 张大威
主权项 一种面向可重构阵列的多参数融合性能建模方法,其特征在于,将一个任务分解成一系列连续的阵列操作p=[1,P],则任务总体执行时间等于多次阵列操作的重构周期数,数据载入周期数,阵列计算周期数以及数据存储周期数的总和再乘以阵列工作频率,即:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>T</mi><mi>E</mi><mi>T</mi><mo>=</mo><mfrac><mn>1</mn><mi>f</mi></mfrac><munder><mo>&Sigma;</mo><mrow><mi>p</mi><mo>&Element;</mo><mi>P</mi></mrow></munder><mrow><mo>(</mo><msub><mi>CFC</mi><mi>p</mi></msub><mo>+</mo><msub><mi>LDC</mi><mi>p</mi></msub><mo>+</mo><msub><mi>CPC</mi><mi>p</mi></msub><mo>+</mo><msub><mi>STC</mi><mi>p</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000818892420000011.GIF" wi="936" he="151" /></maths>其中,TET表示任务的总体执行时间,f表示阵列工作的频率,其中CFC表示重构周期,LDC表示数据载入周期,CPC表示阵列计算周期,STC表示数据存储周期;定义0‑1变量x<sub>p</sub>,当阵列操作需要重构时x<sub>p</sub>=1,当阵列操作不需要重构时x<sub>p</sub>=0,假设所有需要重构的阵列操作中重构周期相等,记为常数CFC,则所有的阵列操作中的重构周期就可表示为:CFC<sub>p</sub>=x<sub>p</sub>CFC,以及整个任务的重构周期数表示为:<img file="FDA0000818892420000012.GIF" wi="515" he="131" />所有的阵列操作中的通信周期数等于每一次阵列操作的载入载出数据量之和除以局部数据存储器的带宽,即:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><munder><mo>&Sigma;</mo><mrow><mi>p</mi><mo>&Element;</mo><mi>P</mi></mrow></munder><mrow><mo>(</mo><msub><mi>LDC</mi><mi>p</mi></msub><mo>+</mo><msub><mi>STC</mi><mi>p</mi></msub><mo>)</mo></mrow><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mi>p</mi><mo>&Element;</mo><mi>P</mi></mrow></munder><mfrac><mrow><msubsup><mi>DATA</mi><mi>p</mi><mi>i</mi></msubsup><mo>+</mo><msubsup><mi>DATA</mi><mi>p</mi><mi>o</mi></msubsup></mrow><mrow><mi>B</mi><mi>W</mi></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA0000818892420000013.GIF" wi="907" he="167" /></maths>其中,BW为数据存储器的带宽,<img file="FDA0000818892420000014.GIF" wi="171" he="88" />为在第p次阵列操作中载入数据的个数,<img file="FDA0000818892420000015.GIF" wi="157" he="78" />为在第p次阵列操作中载出数据的个数;在CrossBar互联形式的阵列中,所有阵列的计算周期为固定的,则整个任务的阵列计算周期为:<img file="FDA0000818892420000016.GIF" wi="657" he="124" />其中CPC为每一次阵列计算都需要跑完流水级的时间周期常数;在Mesh互连形式的阵列中,阵列的计算时间是互联形式和数据依赖长度的函数,则整个任务的阵列计算周期数可以表示为:<img file="FDA0000818892420000017.GIF" wi="619" he="137" />其中RS表示互联形式,<img file="FDA0000818892420000018.GIF" wi="61" he="71" />表示数据依赖长度。
地址 100084 北京市海淀区100084-82信箱