发明名称 | 一种基于多版本代码生成的众核循环分块方法 | ||
摘要 | 本发明提供了一种基于多版本代码生成的众核循环分块方法,其中众核处理器由控制核心和计算核心阵列组成,其中每个计算核心带有一块高速缓存;而且其中每个计算核心自带的一块高速缓存作为片上存储以存储器直接访问的方式与主存进行数据传输;其特征在于,编译器在对众核循环进行并行变换时,根据编译器指示的值来确定循环分块的粒度,从而生成不同版本的并行代码,同时编译器通过代码插装的方式将片上存储的使用信息在运行时进行反馈以便能够根据反馈的使用信息对编译指示的值进行相应的调整,以使得片上存储的利用率最大化。 | ||
申请公布号 | CN105242909A | 申请公布日期 | 2016.01.13 |
申请号 | CN201510829920.9 | 申请日期 | 2015.11.24 |
申请人 | 无锡江南计算技术研究所 | 发明人 | 尉红梅;张立博;孙俊;姜小成 |
分类号 | G06F9/38(2006.01)I | 主分类号 | G06F9/38(2006.01)I |
代理机构 | 北京众合诚成知识产权代理有限公司 11246 | 代理人 | 龚燮英 |
主权项 | 一种基于多版本代码生成的众核循环分块方法,其中众核处理器由控制核心和计算核心阵列组成,其中每个计算核心带有一块高速缓存;而且其中每个计算核心自带的一块高速缓存作为片上存储以存储器直接访问的方式与主存进行数据传输;其特征在于,编译器在对众核循环进行并行变换时,根据编译器指示的值来确定循环分块的粒度,从而生成相应的并行代码,同时编译器利用生成的并行代码通过代码插装的方式将片上存储的使用信息在并行变换运行时进行反馈以便能够根据反馈的使用信息对编译指示的值进行相应的调整,以使得片上存储的利用率最大化。 | ||
地址 | 214083 江苏省无锡市滨湖区军东新村030号 |