发明名称 一种计算机作业调度系统高可用的方法
摘要 本发明提供一种计算机作业调度系统高可用的方法,主要通过heartbeat等高可用软件并结合作业调度软件和NFS共享存储进行实现。在传统的方案中,针对高性能计算机作业调度系统的实现主要是以下方式:高性能计算机作业调度系统单独部署在一台服务器上,一旦该服务器宕机,会造成作业调度系统失灵,导致高性能计算机不能正常进行调度作业,导致作业暂停,造成系统资源浪费。这种方式部署较容易,灵活,但是系统可用性太差,相对于这么重要的应用来说,可用性应该是放在第一位考虑。
申请公布号 CN103279386A 申请公布日期 2013.09.04
申请号 CN201310229097.9 申请日期 2013.06.09
申请人 浪潮电子信息产业股份有限公司 发明人 马四腾
分类号 G06F9/48(2006.01)I;G06F9/455(2006.01)I;H04L29/06(2006.01)I 主分类号 G06F9/48(2006.01)I
代理机构 代理人
主权项 一种计算机作业调度系统高可用的方法, 其特征在于具体步骤如下:使用两台服务器,分别称作服务器1和服务器2,同时部署相同的heartbeat心跳软件和作业调度软件,并配合使用NFS共享存储,其中heartbeat心跳软件作为高可用资源管理,NFS共享存储用于使两台服务器共享需要调度的作业的基本信息,软件成功部署后两台服务器在运行过程中采用Active‑Standby主备方式工作;Heartbeat心跳软件主要管理两个资源,虚拟IP和作业调度服务,平时正常工作时,heartbeat心跳软件会将所有资源集中到主节点服务器1,备节点服务器2处于等待状态,当用户有访问请求时,会通过访问虚拟IP的方式直接访问到主节点服务器1,一旦主节点服务器1发生宕机,Heartbeat心跳软件会通过心跳线检测到主节点服务器1的状态,并同时将所有资源切换到备节点服务器2,此时服务器2变为主节点,由于服务器2工作正常,所以并不影响服务正常使用,这时再将服务器1重启,这时heartbeat心跳软件会通过心跳线检测到服务器1已经正常,服务器1会作为备节点,以便当服务器2故障时,接管heartbeat心跳软件切换过来的资源,致使资源一直运行在某个节点上,实现高可用。
地址 250014 山东省济南市高新区舜雅路1036号