发明名称 一种适用于集群系统的分布式任务故障冗余方法
摘要 本发明公开了一种适用于集群系统的分布式任务故障冗余方法,提供了一种两级任务故障冗余功能,达到提升任务高可靠性、系统高可用性以及用户友好性的目的。本发明所达到的有益效果:1、任务的可靠性提高,分布式任务在集群中运行故障时可以在节点内、节点间及时恢复,提高了集群分布式任务的可靠性;2、系统的可用性提高,管理程序采用了主备冗余技术,且任务故障冗余管理对于用户来说是透明的,用户在使用过程中感觉不到任务故障冗余的存在;3、可移植性好,不需要借助任何操作系统自带软件;4、具有跨平台能力,服务程序可以部署在不同的操作系统服务器上;5、使用简单,用户只需要调用几个接口即可使用故障冗余。
申请公布号 CN105095008A 申请公布日期 2015.11.25
申请号 CN201510528462.5 申请日期 2015.08.25
申请人 国电南瑞科技股份有限公司;国电南瑞南京控制系统有限公司 发明人 苏大威;高原;徐春雷;任升;顾文杰;方华建;庄卫金;孟勇亮;余璟;江叶峰;仇晨光;吴海伟;孙名扬;孙世明;沙一川
分类号 G06F11/07(2006.01)I 主分类号 G06F11/07(2006.01)I
代理机构 南京纵横知识产权代理有限公司 32224 代理人 董建林
主权项 一种适用于集群系统的分布式任务故障冗余方法,其特征是,具体包括以下步骤:1)通过对外接口接受故障冗余管理:所述对外接口提供给上层任务调用,将任务信息添加进故障冗余任务队列内,上层任务进而获得故障冗余管理;2)节点内任务故障冗余:集群中每个节点上的管理程序负责维护本节点上的任务信息,对在本节点上运行的任务进行故障冗余,并负责将本节点上的任务信息同步更新到集群管理节点上;3)任务信息同步:集群中每个节点将本节点上的任务信息同步更新汇总到集群管理节点上;4)节点间任务故障冗余:集群管理节点上的管理程序负责维护整个集群内的任务信息,对故障的任务进行节点间故障冗余,将集群管理节点上的任务信息同步更新到备用节点;节点间故障冗余成功后,任务恢复成功信息由集群管理节点向故障节点立刻同步;5)集群管理节点选举:集群中存在多台集群管理备用节点,当集群管理节点故障时,立即从备用管理节点选举出一台可用的节点对外提供集群管理功能,达到集群管理节点故障冗余;6)任务信息备份冗余:集群管理节点上的任务信息同步更新到备用节点上;7)通过退出接口退出故障冗余管理:所述退出接口提供给上层任务退出时调用,将任务信息从故障冗余任务队列内删除,上层任务进而退出故障冗余管理。
地址 210032 江苏省南京市高新区高新路20号