发明名称 用以在高效能运算环境中对拓朴结构知晓工作进行排程及回填之系统与方法
摘要 一种于高效能运算(HPC)环境之工作管理方法,其包括由多数高效能运算节点决定一个未经配置的节点子集,各个未经配置之HPC节点组成一个整合式组织结构。由一工作伫列中选出一HPC工作,且使用至少部分该未经配置之节点子集执行。
申请公布号 TWI272502 申请公布日期 2007.02.01
申请号 TW094111486 申请日期 2005.04.12
申请人 雷神公司 发明人 大卫森;雷修克斯
分类号 G06F15/173(2006.01);G06F9/445(2006.01);H04L12/24(2006.01) 主分类号 G06F15/173(2006.01)
代理机构 代理人 恽轶群 台北市松山区南京东路3段248号7楼;陈文郎 台北市松山区南京东路3段248号7楼
主权项 1.一种于高效能运算(HPC)环境中进行工作管理之方 法,该方法包含下列步骤: 由复数个高效能运算(HPC)节点决定一未经配置之 子集,该未经配置之HPC节点各自包含一整合式组织 结构; 由一工作伫列中选出一高效能运算(HPC)工作;以及 使用该等未经配置之节点子集之至少一部分来执 行该经选定之工作。 2.如申请专利范围第1项之方法,其中选择该HPC工作 包含基于优先顺位而由该工作伫列中选出该HPC工 作,被选出之工作包含之维度系不大于未经配置之 子集之拓朴结构。 3.如申请专利范围第2项之方法,其中基于优先顺位 而由该工作伫列中选出该HPC工作包含: 基于工作优先顺位而分类该工作伫列; 由该经过分类之工作伫列中选出一第一HPC工作; 以该未经配置之子集之拓朴结构来决定该第一HPC 工作之维度;以及 响应于该第一HPC工作之维度系大于该未经配置之 子集之拓朴结构,由该经分类之工作伫列中选出一 第二HPC工作。 4.如申请专利范围第2项之方法,其中该第一HPC工作 之维度至少部分系基于一或多项工作参数以及相 关联之策略。 5.如申请专利范围第2项之方法,该方法进一步包含 : 至少部分基于该HPC工作之维度,而由该未经配置之 子集动态配置一工作空间;以及 其中执行该选定之工作包含使用该经过动态配置 之工作空间来执行该选定之工作。 6.如申请专利范围第1项之方法,其中该多数HPC节点 组成一第一多数,以及该方法进一步包含: 决定该选定之工作维度系大于该第一多数之拓朴 结构; 由一第二多数选出一或多个HPC节点,第二HPC节点各 自包含一整合式组织结构;以及 将该选定之第二HPC节点加至该未经配置之子集来 满足该经选定之工作之维度。 7.如申请专利范围第6项之方法,进一步包含将该第 二HPC节点返回该第二多数。 8.如申请专利范围第1项之方法,进一步包含: 决定于该多数HPC节点中之一第二子集所执行之第 二HPC工作已经不合格; 将该第二子集加至该未经配置之子集;以及 将该不合格之工作加至该工作伫列。 9.一种储存有于高效能运算环境中进行工作管理 的软体之电脑可读媒体,该软体可操作以进行下列 动作: 由复数个高效能运算(HPC)节点决定一未经配置之 子集,该未经配置之HPC节点各自包含一整合式组织 结构; 由一工作伫列中选出一高效能运算(HPC)工作;以及 使用该等未经配置之节点子集之至少一部分来执 行该经选定之工作。 10.如申请专利范围第9项之电脑可读媒体,其中该 可操作来选择HPC工作之软体包含可操作来基于优 先顺位而由该工作伫列中选出该HPC工作之软体,该 被选出之工作包含之维度系不大于未经配置之子 集之拓朴结构。 11.如申请专利范围第10项之电脑可读媒体,其中该 可操作来基于优先顺位而由该工作伫列中选出HPC 工作之软体包含可操作来执行下列动作之软体: 基于工作优先顺位而分类该工作伫列; 由该经过分类之工作伫列中选出一第一HPC工作; 以该未经配置之子集之拓朴结构来决定该第一HPC 工作之维度;以及 响应于该第一HPC工作之维度系大于该未经配置之 子集之拓朴结构,由该经分类之工作伫列中选出一 第二HPC工作。 12.如申请专利范围第10项之电脑可读媒体,其中该 第一HPC工作之维度至少部分系基于一或多项工作 参数以及相关联之策略。 13.如申请专利范围第10项之电脑可读媒体,其中该 软体进一步可操作来: 至少部分基于该HPC工作之维度,而由该未经配置之 子集动态配置一工作空间;以及 其中该可操作来执行所选定之工作之软体包含可 操作而使用经动态配置之工作空间来执行该选定 之工作之软体。 14.如申请专利范围第9项之电脑可读媒体,其中该 等多数HPC节点组成一第一多数,以及该软体进一步 可操作: 决定该选定之工作维度系大于该第一多数之拓朴 结构; 由一第二多数选出一或多个HPC节点,第二HPC节点各 自包含一整合式组织结构;以及 将该选定之第二HPC节点加至该未经配置之子集来 满足该经选定之工作之维度。 15.如申请专利范围第14项之电脑可读媒体,进一步 包含将该第二HPC节点返回该第二多数。 16.如申请专利范围第9项之电脑可读媒体,该软体 进一步可操作来进行下列动作: 决定于该多数HPC节点中之一第二子集所执行之第 二HPC工作已经不合格; 将该第二子集加至该未经配置之子集;以及 将该不合格之工作加至该工作伫列。 17.一种于高效能运算环境中进行工作管理之系统, 该系统包含: 多数HPC节点,各个节点包括一整合式组织结构;以 及 一管理节点其可操作: 由该等多数HPC节点中决定一未经配置之子集; 由一工作伫列中选出一高效能运算(HPC)工作;以及 使用该等未经配置之节点子集之至少一部分来执 行该经选定之工作。 18.如申请专利范围第17项之系统,其中该可操作来 选择HPC工作之管理节点包含管理节点其可操作来 基于优先顺位而由该工作伫列中选出该HPC工作,被 选出之工作包含之维度系不大于未经配置之子集 之拓朴结构。 19.如申请专利范围第18项之系统,其中该可操作来 基于优先顺位而由该工作伫列中选出HPC工作之管 理节点包含管理节点其可操作: 基于工作优先顺位而分类该工作伫列; 由该经过分类之工作伫列中选出一第一HPC工作; 以该未经配置之子集之拓朴结构来决定该第一HPC 工作之维度;以及 响应于该第一HPC工作之维度系大于该未经配置之 子集之拓朴结构,由该经分类之工作伫列中选出一 第二HPC工作。 20.如申请专利范围第18项之系统,其中该第一HPC工 作之维度至少部分系基于一或多项工作参数以及 相关联之策略。 21.如申请专利范围第18项之系统,该管理节点进一 步可操作来: 至少部分基于该HPC工作之维度,而由该未经配置之 子集动态配置一工作空间;以及 其中该可操作来执行所选定之工作之管理节点包 含可操作而使用经动态配置之工作空间来执行该 选定之工作之管理节点。 22.如申请专利范围第17项之系统,其中该等多数HPC 节点组成一第一多数,以及该管理节点进一步可操 作: 决定该选定之工作维度系大于该第一多数之拓朴 结构; 由一第二多数选出一或多个HPC节点,第二HPC节点各 自包含一整合式组织结构;以及 将该选定之第二HPC节点加至该未经配置之子集来 满足该经选定之工作之维度。 23.如申请专利范围第22项之系统,其中该管理节点 进一步可操作来将该第二HPC节点返回该第二多数 。 24.如申请专利范围第17项之系统,该管理节点进一 步可操作: 决定于该多数HPC节点中之一第二子集所执行之第 二HPC工作已经不合格; 将该第二子集加至该未经配置之子集;以及 将该不合格之工作加至该工作伫列。 图式简单说明: 第1图显示根据本揭示之一具体例,一种范例高效 能运算系统; 第2A-D图显示于第1图之系统之格网之各个具体例 及其用途; 第3A-C图显示于第1图之系统之个别节点之各个具 体例; 第4A-B图显示根据第1图之系统,图形使用者介面之 各个具体例; 第5图显示根据第1图之系统,丛集管理软体之一具 体例; 第6图为流程图,显示根据第1图之高效能运算系统, 一种提交一批次式工作之方法; 第7图为流程图,显示根据第1图之高效能运算系统, 一种动态回填格网之方法;以及 第8图为流程图,显示根据第1图之高效能运算系统, 一种动态管理一节点故障之方法。
地址 美国