发明名称 一种面向GPU的双调归并排序方法
摘要 本发明公开了一种面向GPU的双调排序方法和系统,通过一个线程操作向量来模拟多个比较器,多个线程并行执行归并排序,其中对同一个工作组内的线程同步使用同步函数来完成,对不同工作组内的线程同步通过CPU完成,进一步的可以使用多个向量来模拟更大长度向量,在排序过程中改变比较器操作数的写回地址,对内存读写进行优化。本发明在节省存储空间的基础上,有效地减少CPU和GPU之间的同步次数、减少执行指令的总量和延时、增加GPU计算单元的利用率。
申请公布号 CN102750131A 申请公布日期 2012.10.24
申请号 CN201210187386.2 申请日期 2012.06.07
申请人 中国科学院计算机网络信息中心 发明人 迟学斌;王珏;阚圣哲;聂宁明;郎显宇
分类号 G06F9/38(2006.01)I;G06F9/50(2006.01)I 主分类号 G06F9/38(2006.01)I
代理机构 北京亿腾知识产权代理事务所 11309 代理人 陈霁
主权项 一种面向GPU的双调归并排序方法,其特征在于包括如下步骤:(1)将共享内存中的待排序列数据拷贝到GPU设备局部内存中;(2)判断是否需要进行向量内排序,若需要则由一个线程操作向量模拟L个比较器,多个线程并行执行归并排序;(3)将排序结果由GPU设备局部内存拷贝到共享内存中。
地址 100190 北京市海淀区中关村南四街四号软件园2号楼