发明名称 一种基于任务调度的分布式GPU计算机系统
摘要 本发明公开了一种基于任务调度的分布式GPU计算机系统,系统内的GPU处理单元来自于网络,在与处理单元建立通信之前,可能正处于运算状态,利用任务调度模块根据计算机系统内的各GPU处理单元的当前处理能力对任务块进行分配,根据各GPU处理单元的性能分配工作,保证对资源的高效率利用;同时,实时计算GPU处理单元的利用率,以便及时将系统内多余的GPU处理单元转入待机状态或者在系统内GPU处理单元处理能力不足时,激活GPU处理单元以满足系统需要,也可以保证充分利用GPU处理单元的资源。本发明所述的基于任务分解与调度的分布式GPU计算机系统,解决现有传统的CPU计算存在的计算能力不足的问题,大大提高计算能力。系统设计简单,具有良好的扩展性。
申请公布号 CN102929718B 申请公布日期 2015.03.11
申请号 CN201210344326.7 申请日期 2012.09.17
申请人 厦门坤诺物联科技有限公司 发明人 乐德广
分类号 G06F9/50(2006.01)I 主分类号 G06F9/50(2006.01)I
代理机构 北京远大卓悦知识产权代理事务所(普通合伙) 11369 代理人 史霞
主权项 一种基于任务调度的分布式GPU计算机系统,其特征在于,包括:GPU处理单元,所述GPU处理单元用于处理任务块;中央处理单元,所述GPU处理单元与所述中央处理单元通信,所述中央处理单元包括任务分解模块和任务调度模块,所述中央处理单元监测当前与所述中央处理单元通信的GPU处理单元的个数N以及N个GPU处理单元中的各GPU处理单元的当前处理能力Wi,并计算各GPU处理单元的当前处理能力在N个GPU处理单元的当前处理能力的总和的权重i,其中i=Wi/∑Wi,所述任务分解模块将当前任务均分为M个任务块,所述任务调度模块依据各GPU处理单元的当前处理能力在所有GPU处理单元的当前处理能力的总和的权重i,向各GPU处理单元分配n个任务块,其中n=i×M,所述任务调度模块向各中央处理单元分配任务块时,所述中央处理单元建立有一任务队列响应程序,其中所述任务队列响应程序中包括有一任务队列文件,且所述任务队列文件中记录有n个任务块以及处理所述n个任务块的GPU处理单元,当所述GPU处理单元完成对一个任务块的处理,所述GPU处理单元首先将处理完成的一个任务块的任务数据发送到所述中央处理单元,并响应所述任务队列响应程序,所述中央处理单元将已经被响应的任务块从所述任务队列文件中删除,并且计算所述N个GPU处理单元中各GPU处理单元的利用率,向所述N个GPU处理单元中利用率低于30%的GPU处理单元发出待机命令,则由所述任务调度模块将利用率低于30%的GPU处理单元当前处理的任务块迁移至剩余GPU处理单元中利用率最低的GPU处理单元,所述中央处理单元修改所述任务队列文件,当位于所述任务队列文件中的GPU处理单元的利用率均高于80%时,所述中央处理单元向当前处于待机状态的GPU处理单元发出激活命令,由所述任务调度模块将当前利用率最高的GPU处理单元的当前处理的任务块迁移至被激活的GPU处理单元,所述中央处理单元修改所述任务队列文件,直至所述任务队列文件中的GPU处理单元的平均利用率达到70%。
地址 福建省厦门市湖里区金山街道后坑西潘社308号A295单元