发明名称 基于远程检测和电源管理的高可用集群系统假死解决方法
摘要 本发明提供的基于远程检测和管理的高可用集群系统假死解决方法,属于计算机集群技术领域。该方法通过服务检测脚本来检测服务运行节点状况,然后通过远程电源管理技术重启节点,节点重启后服务能迁移到备份节点,从而保证了系统的高可用性和数据安全性,避免主机假死恢复后服务在两个节点同时运行的状况。保证了整个系统运行的稳定性。该方法可广泛应用于计算机集群技术领域。
申请公布号 CN102510343A 申请公布日期 2012.06.20
申请号 CN201110362913.4 申请日期 2011.11.16
申请人 广东新支点技术服务有限公司 发明人 蔡强;王幸福;袁泉
分类号 H04L12/24(2006.01)I;H04L12/26(2006.01)I;H04L29/08(2006.01)I 主分类号 H04L12/24(2006.01)I
代理机构 广州市越秀区海心联合专利代理事务所(普通合伙) 44295 代理人 马丽丽
主权项 基于远程检测和电源管理的高可用集群系统假死解决方法,其特征在于包括以下步骤:A.集群系统启动时,读取配置文件,取得服务检测时间间隔T和最大检测失败次数N,初始化远程电源管理模块,启动远程检测定时器;集群启动后服务部署的节点即为L2;B.每隔时间T后,其它任意节点L1向节点L2发送探测请求包,在规定的时间内收到节点L2返回的探测响应包则执行步骤C,如果接收探测响应包超时或者探测响应包标示服务在节点L2上运行异常,则执行步骤D;C.探测响应包标示服务运行正常,等待时间间隔T后启动下一次检测;D.当服务连续检测失败次数达到最大检测失败次数N,说明服务在节点L2上不可用,此时节点L1向集群系统中的集中式远程电源管理器发送重启请求,集中式远程电源管理器重启对端节点L2,节点L2关机成功后把运行在节点L2上的服务迁移到备份节点L3;E.节点L2重启完成后,重新加入集群系统。
地址 510663 广东省广州市天河区科技园高唐新建区高普路1021号E栋601室