发明名称 一种Linux系统下的硬盘故障处理方法
摘要 本发明提供一种Linux系统下的硬盘故障处理方法,包括以下步骤:步骤1:配置文件;步骤2:周期性对硬盘进行检测,并将结果保存在硬盘日志文件中;步骤3:提取硬盘状态参数;步骤4:根据硬盘状态参数判断硬盘是否发生或即将发生故障;若是则检测模块发出故障事件给处理模块,并转到步骤5,否则转到步骤2继续执行;步骤5:处理模块根据检测模块传递的故障事件类型,查找相应的故障处理方案;步骤6:通过故障处理方案执行故障处理,完成后退出处理模块,转到步骤2继续执行。本发明方法中用户可以根据自身需要灵活定制,并且在检测到硬盘发生或即将发生故障时,向用户报警、修复硬盘坏道或备份硬盘数据,提高用户使用的灵活性和硬盘数据的安全性。
申请公布号 CN102279775B 申请公布日期 2013.04.17
申请号 CN201110237833.6 申请日期 2011.08.19
申请人 西安交通大学;山东高效能服务器和存储研究院 发明人 董小社;张兴军;王瑜;王恩东;李金泽;陈永刚;黄伟;韩小鹏;康月宁;杨岩;胡雷钧;张东;郑豪;吴楠
分类号 G06F11/00(2006.01)I 主分类号 G06F11/00(2006.01)I
代理机构 西安通大专利代理有限责任公司 61200 代理人 田洲
主权项 一种Linux系统下的硬盘故障处理方法,其特征在于,包括以下步骤:步骤1:配置文件设置硬盘标识、受保护文件路径、备份文件存储路径、报警阈值、检测周期和接收警告信息的邮箱;步骤2:检测模块读取配置文件并获取配置文件中配置的参数,依据检测周期周期性执行系统命令对硬盘进行检测,并将每次检测结果保存在硬盘日志文件中;步骤3:检测模块读取硬盘日志文件,提取相应信息作为硬盘状态参数保存;步骤4:检测模块根据硬盘状态参数与配置文件中配置的报警阈值进行对比,判断硬盘是否发生或即将发生故障;若判断为硬盘发生或即将发生故障,检测模块发出故障事件给处理模块,并转到步骤5触发处理模块执行;否则转到步骤2继续执行;步骤5:处理模块根据检测模块传递的故障事件类型,查找相应的故障处理方案;步骤6:通过故障处理方案执行故障处理,完成后退出处理模块,转到步骤2继续执行;步骤1中所述报警阈值包括报警温度和可容忍未纠正错误率;步骤4中,若硬盘温度高于用户设置的报警温度,检测模块则向处理模块发送温度过高事件;若硬盘可靠状态为FAILURE,检测模块则向处理模块发送预测失效事件;若硬盘未纠正错误率高于用户设置的可容忍未纠正错误率,检测模 块则向处理模块发送错误率高事件;步骤5中,温度过高事件处理方案为:处理模块将警告信息预先保存在一文件中,调用系统命令将警告信息以邮件形式发送给用户步骤1中设置的接收报警信息的邮箱中;预测失效事件处理方案为:处理模块将警告信息预先保存在一文件中,调用系统命令将警告信息以邮件形式发送给用户步骤1中设置的接收报警信息的邮箱中,并且根据配置文件参数执行系统命令将受保护文件路径目录下的文件备份到备份文件存储路径下指定的文件中;错误率高事件处理方案为:处理模块将警告信息预先保存在一文件中,调用系统命令将警告信息以邮件形式发送给用户步骤1设置的接收报警信息的邮箱中,然后根据配置文件参数执行系统命令对用户设置的硬盘标识进行磁盘坏道修复;检测模块利用开源工具smartmontools提供的命令smartctl来生成硬盘的日志文件,该文件将包含被检测硬盘的型号、容量、温度、硬盘读写错误以及硬盘自检状态信息;被检测的硬盘为支持自我监测、分析及报告技术的硬盘。
地址 710049 陕西省西安市咸宁西路28号