发明名称 |
集群系统中节点的故障检测方法和装置 |
摘要 |
本发明实施例提供一种集群系统中节点的故障检测方法和装置,该方法包括:第一节点判断在预设时间内是否接收到第二节点发送的第一心跳报文,第一节点为第二节点的邻居节点,第一心跳报文为第二节点并行地向第二节点的每一邻居节点发送的一个心跳报文;在第一节点未接收到第二节点发送的心跳报文的情况下,向第二节点的所有邻居节点中除第一节点之外的其他邻居节点发送请求消息;第一节点接收其他邻居节点发送的携带有接收状态的响应消息;在第一节点根据接收状态确定出其他邻居节点均未接收到心跳报文的情况下,第一节点确定第二节点发生故障。本发明实施例提供的集群系统中节点的故障检测方法和装置能够提高节点故障检测的效率。 |
申请公布号 |
CN106301853A |
申请公布日期 |
2017.01.04 |
申请号 |
CN201510306800.0 |
申请日期 |
2015.06.05 |
申请人 |
华为技术有限公司 |
发明人 |
胡琳;伍湘平;彭佩星 |
分类号 |
H04L12/24(2006.01)I;H04L12/26(2006.01)I |
主分类号 |
H04L12/24(2006.01)I |
代理机构 |
北京同立钧成知识产权代理有限公司 11205 |
代理人 |
娄冬梅;黄健 |
主权项 |
一种集群系统中节点的故障检测方法,其特征在于,包括:第一节点判断在预设时间内是否接收到第二节点发送的第一心跳报文;所述第一节点为所述第二节点的邻居节点,所述第一心跳报文为所述第二节点并行地向所述第二节点的每一邻居节点发送的一个心跳报文,所述第二节点的所有邻居节点的数目为两个以上;所述预设时间大于或等于一个心跳周期,且小于两个心跳周期;在所述第一节点未接收到所述第二节点发送的第一心跳报文的情况下,所述第一节点向所述第二节点的所有邻居节点中除所述第一节点之外的其他邻居节点发送请求消息,所述请求消息用于询问所述其他邻居节点是否接收到所述第一心跳报文;所述第一节点接收所述其他邻居节点发送的携带有接收状态的响应消息,所述接收状态用于表示是否接收到所述第一心跳报文;在所述第一节点根据接收到的每一所述其他邻居节点发送的所述响应消息中携带的接收状态,确定出所述其他邻居节点均未接收到所述第一心跳报文的情况下,所述第一节点确定所述第二节点发生故障。 |
地址 |
518129 广东省深圳市龙岗区坂田华为总部办公楼 |