发明名称 双进程冗余瞬时故障容错方法
摘要 本发明提供的是一种双进程冗余瞬时故障容错方法。由双进程冗余故障检测用户级模块、双进程冗余故障检测内核级模块、检查点设置用户级模块、检查点设置内核级模块、检查点卷回恢复用户级模块和检查点卷回恢复内核级模块六个模块组成的Linux内核模块实现。该方法将任务进程进行派生,派生出一个傀儡进程和两个任务进程(主任务进程和从任务进程),通过两个任务进程系统调用参数的比较及系统调用的执行和模拟,实现系统调用参数的瞬时故障检测;通过任务进程正常运行过程中设置的检查点实现故障后的卷回恢复。开销低,适用于基于普通硬件架构的进程级双模冗余容错方法,通用性好。
申请公布号 CN103064770A 申请公布日期 2013.04.24
申请号 CN201310006126.5 申请日期 2013.01.08
申请人 哈尔滨工程大学 发明人 门朝光;何忠政;李香;冯红斌
分类号 G06F11/16(2006.01)I 主分类号 G06F11/16(2006.01)I
代理机构 代理人
主权项 一种双进程冗余瞬时故障容错方法,由双进程冗余故障检测用户级模块、双进程冗余故障检测内核级模块、检查点设置用户级模块、检查点设置内核级模块、检查点卷回恢复用户级模块和检查点卷回恢复内核级模块六个模块组成的Linux内核模块实现,其特征是具体包括如下步骤:(1)应用程序执行时,由双进程冗余故障检测用户级模块调用变量初始化函数,对配置变量、用户参数进行初始化,然后注册检查点设置信号和双进程冗余比较结果信号,实现检查点设置的响应、傀儡进程和主/从任务进程的信息通信;接着应用程序进程调用fork系统调用,派生出两个子进程,并调用execve系统调用,将自身替换为用户任务进程;最后将应用程序作为参数,传给双进程冗余故障检测内核级模块,应用程序进程本身退化为傀儡进程;(2)双进程冗余故障检测内核级模块实现系统调用的封装、傀儡进程和主/从任务进程的注册、系统调用参数瞬时故障检测;(3)检查点设置用户级模块实现检查点设置信号的响应,并调用检查点设置内核级模块实现检查点状态的保存;(4)检查点设置内核级模块实现检查点设置信号的处理,完成任务进程检查点状态的保存;(5)检查点卷回恢复用户级模块实现傀儡进程检查点卷回恢复的响应,并调用检查点卷回恢复内核级模块实现进程的卷回恢复;(6)检查点卷回恢复内核级模块实现故障进程卷回恢复。
地址 150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室