发明名称 |
一种面向GPU的双调归并排序方法 |
摘要 |
本发明公开了一种面向GPU的双调排序方法和系统,通过一个线程操作向量来模拟多个比较器,多个线程并行执行归并排序,其中对同一个工作组内的线程同步使用同步函数来完成,对不同工作组内的线程同步通过CPU完成,进一步的可以使用多个向量来模拟更大长度向量,在排序过程中改变比较器操作数的写回地址,对内存读写进行优化。本发明在节省存储空间的基础上,有效地减少CPU和GPU之间的同步次数、减少执行指令的总量和延时、增加GPU计算单元的利用率。 |
申请公布号 |
CN102750131A |
申请公布日期 |
2012.10.24 |
申请号 |
CN201210187386.2 |
申请日期 |
2012.06.07 |
申请人 |
中国科学院计算机网络信息中心 |
发明人 |
迟学斌;王珏;阚圣哲;聂宁明;郎显宇 |
分类号 |
G06F9/38(2006.01)I;G06F9/50(2006.01)I |
主分类号 |
G06F9/38(2006.01)I |
代理机构 |
北京亿腾知识产权代理事务所 11309 |
代理人 |
陈霁 |
主权项 |
一种面向GPU的双调归并排序方法,其特征在于包括如下步骤:(1)将共享内存中的待排序列数据拷贝到GPU设备局部内存中;(2)判断是否需要进行向量内排序,若需要则由一个线程操作向量模拟L个比较器,多个线程并行执行归并排序;(3)将排序结果由GPU设备局部内存拷贝到共享内存中。 |
地址 |
100190 北京市海淀区中关村南四街四号软件园2号楼 |