发明名称 一种分布式计算机系统故障处理流程
摘要 本发明提供一种分布式计算机系统故障处理流程,主要用于对分布计算机系统的故障分级别进行处理,不同级别不同故障类型采取相应处理措施,保证系统故障全面有效地处理,提高系统运行可靠性。该分布式计算机系统故障处理流程包括:1]对分布式计算机系统的故障进行分类;2]系统发生故障后由系统故障检测机制进行检测,过滤较小故障,处理其他故障,无法处理的故障则发送上级处理,严重故障人工处理。本发明分级别进行故障处理,可以降低故障处理复杂度,保证各种故障能够得到有效地处理,保证高优先级的任务能够可靠运行。
申请公布号 CN103605581A 申请公布日期 2014.02.26
申请号 CN201310638727.8 申请日期 2013.11.29
申请人 中国航空工业集团公司第六三一研究所 发明人 李成文;牛文生;孙靖国;李鹏;王明;何小亚;刘宇;余松涛;陈国;湛文韬;高杨;杨涛
分类号 G06F11/07(2006.01)I;G06F11/00(2006.01)I 主分类号 G06F11/07(2006.01)I
代理机构 西安智邦专利商标代理有限公司 61211 代理人 杨引雪
主权项 一种分布式计算机系统故障处理流程,其特征在于,包括以下步骤: 1]对分布式计算机系统的故障按照进程级、分区级、模块级、系统级四个层次级别进行分类; 2]系统发生故障后由系统故障检测机制进行检测,将检测到的故障报给操作系统的健康监控HM服务,健康监控HM服务对故障进行过滤,若是瞬时故障或影响较小的故障则直接忽略,否则把确认后的故障交给故障管理FM进行分类别处理;本级别处理不了的故障上报上一级健康监控HM服务处理,顶层故障交给系统配置管理CM进行处理。 
地址 710119 陕西省西安市锦业二路15号