发明名称 一种多用户共享GPU资源的调度方法
摘要 本发明公开了一种多用户共享GPU资源的调度方法,属于云计算和虚拟机技术领域,包括用户向管理模块提出请求的步骤;修改、撤销请求流程的步骤;开始GPU流程的步骤以及结束GPU流程的步骤;本发明能够在仅配置一个GPU虚拟化设备卡的情况下,更多的满足用户的需求,并且提高了GPU设备的利用率,有效的节约了资源。
申请公布号 CN105528249A 申请公布日期 2016.04.27
申请号 CN201510884813.6 申请日期 2015.12.06
申请人 北京天云融创软件技术有限公司 发明人 孙明来;刘毅;贾琨
分类号 G06F9/50(2006.01)I 主分类号 G06F9/50(2006.01)I
代理机构 北京科亿知识产权代理事务所(普通合伙) 11350 代理人 汤东凤
主权项 一种多用户共享GPU资源的调度方法,其特征在于包括:用户向管理模块提出请求的步骤;修改、撤销请求流程的步骤;开始GPU流程的步骤以及结束GPU流程的步骤;所述用户向管理模块提出请求按以下步骤进行:步骤一、判断用户VM情况,并向管理模块提出请求:当用户已有VM且有使用GPU资源的需要时,查询GPU资源;系统提供用户VM可用GPU资源预约表;用户从预约表中选择预约时段及能力,并向管理模块提出请求,然后执行步骤二;如果是新使用,创建带GPU功能的VM或在已有的VM中增加GPU功能,并向管理模块提出请求,然后执行步骤二;如果在预约的时间已满的时候,需要继续使用GPU功能,则为续约:向管理模块提出请求时需要指明需要GPU核数,如果是已有的VM,同时需要携带VM的标识信息;步骤二:管理模块接收到请求后,对请求进行处理A1:判断用户是续约请求、新建VM+GPU请求还是已有VM+GPU请求;A2:检查用户的请求是否有效,包括用户的GPU使用额度,即同时能够申请使用的GPU核数限制;A3:对用户的请求进行记录;如果用户需要续约,则直接进行续约,流程结束,否则开始GPU流程;所述开始GPU流程按以下步骤进行:管理模块定时检查系统中的GPU进行维护:检查是否有将要开始的请求;如果有即将开始的请求,则检查系统中的资源是否满足;如果满足,则向Hypervisor发送请求;如果不满足,则将用户的GPU使用时间延后,并通知用户;管理模块向Hypervisor发送请求;Hypervisor根据请求来进行操作:创建带GPU功能的VM或为已有的VM添加GPU设备;然后为VM配置GPU虚拟设备;所述结束GPU流程按以下步骤进行:管理模块定时检查系统中的GPU进行维护:检查是否有将要到期的请求;如果有将要到期的请求,检查系统中是否有足够的资源允许用户续约;如果系统中有足够的资源允许用户继续使用,则先对资源进行预占,并提示用户,资源即将到期,是否进行续约;如果用户在到期前未进行续约,则将预占资源释放;如果系统中无足够的资源允许用户继续使用,则提示用户GPU应用将要到期,请及时存档;管理模块向Hypervisor发送请求;Hypervisor根据请求来进行操作:删除带GPU功能的VM;为已有的VM卸载GPU设备。
地址 100176 北京市大兴区北京经济技术开发区地盛北街1号18号楼6层604号