发明名称 |
故障快速检测方法及装置 |
摘要 |
本发明提供一种故障快速检测方法及装置,该方法包括:通过内核黑匣子KBox组检测操作系统出现的故障,根据检测到的故障形成故障信息;所述KBox组通过基础设施层的管理单元将包含所述故障信息的系统故障通告信息发送至应用高可用性HA子系统以触发所述应用HA子系统的业务故障处理。从而实现快速检测出操作系统中出现的故障或亚健康问题,并及时通知业务应用层进行故障处理以降低业务损失。 |
申请公布号 |
CN103559124B |
申请公布日期 |
2017.04.12 |
申请号 |
CN201310507154.5 |
申请日期 |
2013.10.24 |
申请人 |
华为技术有限公司 |
发明人 |
谢军勇;刘涛;夏海 |
分类号 |
G06F11/36(2006.01)I;G06F9/455(2006.01)I |
主分类号 |
G06F11/36(2006.01)I |
代理机构 |
北京同立钧成知识产权代理有限公司 11205 |
代理人 |
刘芳 |
主权项 |
一种故障快速检测方法,其特征在于,包括:内核黑匣子KBox组检测操作系统出现的故障,根据检测到的故障形成故障信息;所述KBox组通过基础设施层的管理单元将包含所述故障信息的系统故障通告信息发送至应用高可用性HA子系统以触发所述应用HA子系统的业务故障处理;其中,所述KBox组检测操作系统出现的故障,根据检测到的故障形成故障信息,包括:所述KBox组内的第一KBox检测客户操作系统出现的故障,根据检测到的故障形成第一故障信息;其中,所述第一KBox设置在虚拟机内,所述第一故障信息中包含故障原因,故障描述,故障发生时间以及故障对应的虚拟机标识;相应的,所述管理单元为宿主操作系统内的基础设施管理单元BMU;所述KBox组通过基础设施层的管理单元将包含所述故障信息的系统故障通告信息发送至应用高可用性HA子系统以触发所述应用HA子系统的业务故障处理,包括:所述第一KBox将所述第一故障信息发送至所述BMU,以使所述BMU将包含所述第一故障信息、以及与所述第一KBox对应的虚拟机标识的第一系统故障通告信息发送至与所述虚拟机对应的应用HA子系统,以触发所述应用HA子系统的业务故障处理。 |
地址 |
518129 广东省深圳市龙岗区坂田华为总部办公楼 |