发明名称 作为服务的故障检测与恢复
摘要 由监控节点进行的对由被监控节点执行的进程的监控经常被设计为紧密耦合交互,但是这种耦合可以降低监控资源和进程的再使用并且增加了监控情况的管理复杂性。相反,故障检测和恢复可以被设计为一种非专有服务,其中一组被监控的节点连同执行一组进程可以注册以便由一组监控节点监控。在进程或整个被监控节点故障的情况下,监控节点可以合作来发起在相同或替代的被监控节点上重启所述进程(可能处于由相应进程最后报告的状态)。此外,监控节点的故障可被检测到,并且所有被分配给故障的监控节点的被监控节点可以被重新分配给替代的监控节点。
申请公布号 CN102739435A 申请公布日期 2012.10.17
申请号 CN201210090006.3 申请日期 2012.03.30
申请人 微软公司 发明人 A.卡蒂亚;C.B.波利纳蒂
分类号 H04L12/24(2006.01)I;H04L12/26(2006.01)I 主分类号 H04L12/24(2006.01)I
代理机构 中国专利代理(香港)有限公司 72001 代理人 李舒;刘鹏
主权项 一种配置具有处理器(156)的监控节点(18)以监控执行至少一个进程(16)的被监控节点(14)的方法(50),该方法(50)包括:在处理器(156)上执行(54)指令(96),该指令(96)被配置成:在接收监控被监控节点(14)的请求时,注册(56)被监控节点(14)的至少一个进程(16)以便监控;在从被监控节点(14)的进程(16)接收至少一个状况(42)时,记录(58)进程(16)的状况(42);以及在检测到被监控节点(14)的至少一个进程(16)的故障时,在被监控节点(14)上重启(60)进程(16)。
地址 美国华盛顿州