发明名称 一种基于龙芯平台的高性能计算资源监控实现方法
摘要 本发明公开了一种基于龙芯平台的高性能计算资源监控实现方法,所述方法采用龙芯多单元服务器的N个服务器构成集群,其中1个服务器作为控制节点、剩余服务器作为计算节点;每个服务器均通过其北桥的PCIE总线扩展高速通信设备infiniband接口,在控制节点与计算节点中对资源监控软件进行修改编译,使其可以适用于龙芯平台,组建可实时监控各个节点的网络,使用户可以在控制节点登陆浏览器查看各个节点的资源占用状态;用户在控制节点中通过OpenMPI中的mpirun指令,将作业分发于各计算节点执行,各计算节点完成作业任务后,由控制节点进行收集,并得出最终的数据处理结果。本发明具有设计科学、使用方便等优点,可在国产化计算机服务器领域尤其是申威平台中实现,便于推广使用,可以应用于陆地、航空、卫星等领域。
申请公布号 CN104468810A 申请公布日期 2015.03.25
申请号 CN201410786020.6 申请日期 2014.12.18
申请人 山东超越数控电子有限公司 发明人 赵瑞东;陈亮甫;吴登勇
分类号 H04L29/08(2006.01)I;H04L12/26(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 济南信达专利事务所有限公司 37100 代理人 张靖
主权项 一种基于龙芯平台的高性能计算资源监控实现方法,其特征在于,所述方法实现步骤如下: 1)采用龙芯多单元服务器的N个服务器构成集群,其中1个服务器作为控制节点、剩余服务器作为计算节点;2)每个服务器均通过其北桥的PCIE总线扩展高速通信设备infiniband接口,并与服务器的infiniband交换机相连,进而构建控制节点与计算节点之间的数据通信网络;3)在每个服务器的操作系统中配置infiniband通信方式为IPoIB方式,以此来进行并行程序间的数据通信;4)分别在控制节点与计算节点中修改编译OpenMPI,使其可以在龙芯平台中应用,部署基于OpenMPI的并行程序编译与运行环境;5)在控制节点与计算节点中对资源监控软件进行修改编译,使其可以适用于龙芯平台,组建可实时监控各个节点的网络,使用户可以在控制节点登陆浏览器查看各个节点的资源占用状态;6)用户在控制节点中通过OpenMPI中的mpirun指令,将作业分发于各计算节点执行,各计算节点完成作业任务后,由控制节点进行收集,并得出最终的数据处理结果。
地址 250100 山东省济南市高新区孙村镇科航路2877号