发明名称 一种海量数据的分布式存储方法
摘要 本申请公开了一种海量数据的分布式存储方法,该方法包括:当获取到输入文件时,对输入文件进行分割处理,相应地得到N份块文件;分别对每一份块文件进行特征信息提取处理,相应地得到每一份块文件的特征信息;对上述N份块文件中具有相同特征信息的块文件归为一类,相应地得到M类文件;分别对每一类文件进行文件合并,相应地得到M份合并文件,并对上述M份合并文件进行存储。本申请中,当接收到输入文件后,先对输入文件进行分割,并将分割后得到的多个块文件的特征信息提取出来,然后将具有相同特征信息的块文件归为一类,进而将每一类文件进行合并存储,由此实现了对多个块文件的特征信息的挖掘,进而实现了对数据合理高效的存储。
申请公布号 CN105430078A 申请公布日期 2016.03.23
申请号 CN201510791440.8 申请日期 2015.11.17
申请人 浪潮(北京)电子信息产业有限公司 发明人 李傲
分类号 H04L29/08(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 罗满
主权项 一种海量数据的分布式存储方法,其特征在于,包括:当获取到输入文件时,对所述输入文件进行分割处理,相应地得到N份块文件,N为正整数;分别对所述N份块文件中的每一份块文件进行特征信息提取处理,相应地得到每一份块文件的特征信息;对所述N份块文件中具有相同特征信息的块文件归为一类,相应地得到M类文件,其中,M为不大于N的正整数;分别对所述M类文件中的每一类文件进行文件合并,相应地得到M份合并文件,并对所述M份合并文件进行存储。
地址 100085 北京市海淀区上地信息路2号2-1号C栋1层