发明名称 在并行计算机数据通信网络中定位硬件故障的方法和设备
摘要 定位并行计算机的数据通信网络中的硬件故障。这样的并行计算机包括多个计算节点和耦合用于数据通信的该多个计算节点并将该计算节点组织为树的数据通信网络。定位硬件故障包括将下一计算节点标识为父节点和父测试树的根节点;为父节点的每个子计算节点标识具有将该子计算节点作为根节点的子测试树;在父测试树和每个子测试树上运行相同的测试套件;和如果测试套件对父测试树失败,而对所有的子测试树成功,则将父计算节点标识为具有从该父计算节点连接到子计算节点的缺陷链接。
申请公布号 CN101055536A 申请公布日期 2007.10.17
申请号 CN200710005781.3 申请日期 2007.02.13
申请人 国际商业机器公司 发明人 查尔斯·J·阿彻;马克·G·梅格瑞恩;约瑟夫·D·拉特曼;布赖恩·E·史密斯
分类号 G06F11/00(2006.01);G06F15/173(2006.01) 主分类号 G06F11/00(2006.01)
代理机构 北京市柳沈律师事务所 代理人 郭定辉;黄小临
主权项 1.一种定位并行计算机的数据通信网络中的硬件故障的方法,该并行计算机包括多个计算节点和耦合用于数据通信的该多个计算节点并将该多个计算节点组织为树的数据通信网络,该方法包括针对并行计算机的多个分支计算节点重复执行下面的步骤:将下一计算节点标识为父节点和父测试树的根节点;为该父节点的每个子计算节点标识具有将该子计算节点作为根节点的子测试树;在父测试树和每个子测试树上运行相同的测试套件;和如果测试套件对父测试树失败,而对所有的子测试树成功,则将父计算节点标识为具有从该父计算节点连接到子计算节点的缺陷链接。
地址 美国纽约阿芒克