发明名称 |
一种在计算机存储介质上存储文件的方法及系统 |
摘要 |
本发明提供一种在计算机存储介质上大量文件的存储方法及系统,包括使用存储介质名称、文件HASH和文件大小的进行联合编码的文件命名方式;使用基于单个文件HASH和该文件的文件名的HASH进行编码而命名的多层目录结构进行存储该文件的存储方式;使用根据存储空间的可用空间大小动态设定存储文件时分配给每个存储介质进行存储该文件的几率权重的方法。 |
申请公布号 |
CN106446001A |
申请公布日期 |
2017.02.22 |
申请号 |
CN201610609625.7 |
申请日期 |
2016.07.29 |
申请人 |
北京北信源软件股份有限公司 |
发明人 |
郎志新;杜军;韩烁 |
分类号 |
G06F17/30(2006.01)I;G06F3/06(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京连城创新知识产权代理有限公司 11254 |
代理人 |
郝学江 |
主权项 |
一种在计算机存储介质上存储文件的方法,其特征在于,包括以下步骤:文件命名步骤,使用存储介质名称、文件HASH和文件大小进行联合编码的文件命名方式对待存储文件进行命名;文件存储步骤,使用基于单个文件HASH和该文件的文件名的HASH进行编码而命名的多层目录结构进行存储该文件的存储,其中,根据存储空间的可用空间大小动态设定存储文件时分配给每个存储介质进行存储该文件的几率权重;所述文件存储步骤具体为:分别在文件内容的HASH字符串和文件名称的HASH字符串的指定位置上取两位作为文件夹名称,建立双层目录结构,将文件存储到该目录结构的最底层文件夹下;文件存储前对编号的存储介质的可用空间进行计算,然后将该编号存储介质的可用空间大小在总的可用空间大小中所占的百分比作为存储文件时分配到该编号存储介质上的概率;文件在存储前,使用文件的HASH值与文件大小在在持久化存储中进行检索,如果找到相同的值,说明重复文件已经存在,只需在持久化存储中建立新文件信息与该文件的唯一编号的映射关系。 |
地址 |
100081 北京市海淀区中关村南大街34号中关村科技发展大厦C座1602室 |