发明名称 |
一种基于IPMI的冗余计算机系统节点故障主被动检测方法 |
摘要 |
本发明公开了一种冗余计算机系统的故障主被动检测方法。该方法包括第一步:利用冗余待测计算机的IPMI标准接口,故障检测模块实时收集冗余系统中待测的主用计算机和备用计算机的状态数据,收集到一定数量的运行状态数据后;第二步:故障检测模块通过模式匹配方法诊断待测计算机是否出现运行故障;第三步:依据给定的系统参数值,预测主用计算机一段时间内出现故障事件的概率。作为实现多台计算机冗余系统容错不可或缺的基础组件之一,本发明故障主被动检测方法能够在一定程度上降低故障检测的时间延迟、提高故障检测的准确性、预测故障发生概率,以支撑关键服务系统的快速失效切换和主动容错等高可用保障机制。 |
申请公布号 |
CN103617104A |
申请公布日期 |
2014.03.05 |
申请号 |
CN201310634139.7 |
申请日期 |
2013.12.01 |
申请人 |
中国船舶重工集团公司第七一六研究所 |
发明人 |
徐振朋;翟永宁;殷进勇;杨光年;李韦韦;吴茂传;苏培培;楼智翔;董奇;史小犇 |
分类号 |
G06F11/22(2006.01)I;G06F11/07(2006.01)I |
主分类号 |
G06F11/22(2006.01)I |
代理机构 |
南京理工大学专利中心 32203 |
代理人 |
马鲁晋 |
主权项 |
一种基于IPMI的冗余计算机系统节点故障主被动检测方法,其特征在于:包括以下步骤:步骤1、在所有待测计算机上部署并启用IPMI功能模块,并通过标准RJ45接口或串行接口与故障检测模块相连接;所有待测计算机构成冗余备份系统;步骤2、通过IPMI协议周期性地收集上述冗余系统中主备计算机节点的运行状态信息序列p,所述状态信息包括CPU、风扇、内存和部件状态数据;步骤3、对步骤2采集到的状态信息序列p进行分析,通过模式匹配方法分别对主备计算机节点的运行状态进行故障判定,即故障被动检测;步骤4、在给定的系统参数值的前提下,通过对主用计算机节点故障进行预测,即故障主动检测,确定在何时对上述冗余系统实施主动式的主备切换。 |
地址 |
222006 江苏省连云港市新浦区海连东路42号 |