发明名称 |
使用GPU/CPU体系结构的RSA的高效实现 |
摘要 |
各实施例涉及在同一个处理器管芯上由CPU和GPU构成的异构型处理器体系结构。异构型处理器体系结构可以使用将任意矢量长度的指令简化为GPU支持的矢量长度的矢量条状提取以及循环剥离来在GPU编译器中优化源代码。首先可以判断,如果编译的源代码的一个以上的机器代码指令未充分使用GPU指令带宽限制,则源代码有资格获得优化。可以丢弃初始矢量条状提取结果,可以从循环中剥离内循环体的第一迭代。源代码中的操作数的类型可以被降低,可以再次矢量条状提取的源代码的剥离的内循环体,以获得优化的源代码。 |
申请公布号 |
CN103959238A |
申请公布日期 |
2014.07.30 |
申请号 |
CN201180075165.X |
申请日期 |
2011.11.30 |
申请人 |
英特尔公司 |
发明人 |
康晓珠;B·乔治;K·陆 |
分类号 |
G06F9/30(2006.01)I;G06F9/45(2006.01)I |
主分类号 |
G06F9/30(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
高见 |
主权项 |
一种方法,包括:使用图形处理单元(GPU)编译器来编译具有内循环体的源代码;当编译的源代码的一个以上的机器代码指令未充分使用GPU指令带宽限制时:从所述循环中剥离所述内循环体的第一迭代;降低所述源代码中的操作数的类型;以及使用矢量条状提取将任意矢量长度的指令简化为源代码的所述剥离的内循环体中的图形处理单元(GPU)支持的矢量长度,以获取优化的源代码。 |
地址 |
美国加利福尼亚州 |