发明名称 一种多副本存储系统的磁盘故障处理方法
摘要 本发明提供了一种多副本存储系统的磁盘故障处理方法,采用多副本的方式保存对象,同一对象的不同副本存储在不同的OSD上;同一对象的副本中有一个是主副本,修改操作发给该副本,主副本将操作发给从副本;操作过程中出现IO错误时,通过磁盘故障模块确定磁盘故障类型,然后确定处理方法,如果是磁盘瞬时的故障,则等待该盘重新加入系统;如果是磁盘坏道,则认为对象坏道,重现对象;如果是磁盘永久失效,则重建该盘上的所有数据。本发明丰富了磁盘故障的处理,减少了修复数据的总量,大大提高了修复的效率。
申请公布号 CN102385537B 申请公布日期 2014.12.03
申请号 CN201110328291.3 申请日期 2011.10.25
申请人 曙光信息产业(北京)有限公司 发明人 付根希;姜国梁;彭成;苗艳超
分类号 G06F11/07(2006.01)I 主分类号 G06F11/07(2006.01)I
代理机构 北京安博达知识产权代理有限公司 11271 代理人 徐国文
主权项 一种多副本存储系统的磁盘故障处理方法,其特征在于:采用多副本的方式保存对象,同一对象的不同副本存储在不同的OSD上;同一对象的副本中有一个是主副本,修改操作发给该副本,主副本将操作发给从副本;操作过程中出现IO错误时,通过磁盘故障模块确定磁盘故障类型,然后确定处理方法,如果是磁盘瞬时的故障,则等待该盘重新加入系统;如果是磁盘坏道,则认为对象坏道,重现对象;如果是磁盘永久失效,则重建该盘上的所有数据;所述瞬时故障的磁盘,为其添加一个定时器,在定时器未触发之前,磁盘加入系统为可用,则取消定时器;否则将该磁盘视为永久失效,重建该磁盘上的数据;所述磁盘加入系统为可用后,只拷贝故障期间发生的数据操作;所述磁盘坏道时,记录该磁盘的坏道数,当磁盘坏道数超过阈值时,将磁盘按永久失效处理;所述磁盘永久失效后,OSD将该磁盘信息告知MDS,在MDS的主导下修复磁盘;所述从副本在操作时,遇到磁盘故障,调用磁盘判定程序,确定磁盘的错误类型,报告给管理线程,从副本将错误类型应答主副本,主副本标识从副本的错误类型,向MDS报告从副本故障状态,以后修复该从副本;所述主副本在操作时,遇到磁盘故障,调用磁盘判定程序,确定磁盘的错误类型,报告给管理线程,主副本触发换主操作,在MDS的控制下,选择新的主副本,并将旧主标识为错误,以后进行修复;所述重建磁盘数据的方法为,在MDS的总体控制下,由主副本修复对象,所述MDS存储着每个磁盘上的对象信息,当主副本在该盘上时,通过换主操作,重新选择可用的主副本,MDS为丢失的对象选择新的磁盘,将需要修复的对象发给主副本,由主副本主导对象的修复操作;所述主副本修复对象时,先设置修复标识,后续的客户端的修改操作由修复线程在修复的过程中处理,并应答客户端,修复线程继续修复对象,直到修复完成;所述修复过程中,如果出现新的故障,影响数据修复时,修复过程停止,待故障解除后,重新出发修复过程。
地址 100084 北京市海淀区水磨西街64号