发明名称 一种基于网络控制器的超大规模栅栏同步方法
摘要 一种基于网络控制器的超大规模栅栏同步方法,步骤为:(1)、进行MPI栅栏同步调用,软件构造同步通信域,并将参与线程与物理节点的映射关系发送给所有参与节点;(2)、基于软件线程号,构建栅栏同步描述符;(3)、基本节点的信息,完成线程号与物理节点号的映射,生成同步描述符;(4)、栅栏同步描述符提交给硬件执行;(5)、NIC收到描述符后,按照描述符中规定的步骤,向目的物理节点发送栅栏同步报文,并接收源节点发送来的栅栏同步报文;收到报文后,给出响应报文;(6)、执行完成后,硬件向软件返回执行结果;(7)、软件收到完成响应后,完成同步操作。本发明可有效提高MPI等并行应用程序的栅栏同步性能、简化NIC硬件设计复杂度。
申请公布号 CN103116527B 申请公布日期 2016.12.28
申请号 CN201310069844.7 申请日期 2013.03.05
申请人 中国人民解放军国防科学技术大学 发明人 徐炜遐;王绍刚;肖立权;庞征斌;王克非;夏军;童元满;陈虎;张峻;齐星云;王桂彬;常俊胜;张建民;罗章;徐金波;董德尊;赖明澈;陆平静
分类号 G06F9/52(2006.01)I 主分类号 G06F9/52(2006.01)I
代理机构 湖南兆弘专利事务所(普通合伙) 43008 代理人 赵洪;周长清
主权项 一种基于网络控制器的超大规模栅栏同步方法,其特征在于,步骤为:步骤(1):一次栅栏同步操作首先由并行程序的一次MPI栅栏同步调用开始;进入该调用后,软件构造同步通信域,并将参与软件线程与物理节点的映射关系发送给所有参与物理节点;步骤(2):基于软件线程号,构建栅栏同步描述符;即在现有栅栏同步软件执行算法的基础上,构造硬件独立执行该算法时需要的信息,但软件不执行实际的通信操作;步骤(3):通过物理节点的信息,完成软件线程号与物理节点号的映射,生成最终的同步描述符;所述同步描述符为一种数据结构,硬件根据约定解析其中的内容;步骤(4):栅栏同步描述符提交给硬件执行;步骤(5):网络接口控制器NIC收到描述符后,按照描述符中规定的步骤,向目的物理节点发送栅栏同步报文,并按步骤接收源物理节点发送来的栅栏同步报文,收到报文后,给出响应报文;步骤(6):同步描述符中所有的步骤执行完成后,硬件向软件返回执行结果;步骤(7):软件收到硬件返回的完成响应后,一次完整的栅栏同步操作完成,继续执行后续程序。
地址 410073 湖南省长沙市砚瓦池正街47号中国人民解放军国防科学技术大学计算机学院