发明名称 数据并行压缩方法
摘要 一种数据并行压缩方法,该方法包括读取步骤,通过并行I/O从存储装置中读取待压缩数据;切分步骤,将待压缩数据均匀切分成N个数据块,并将所述N个数据块保存至每个数据块所对应的输入缓冲区;压缩编码步骤,每个进程控制对应的输入缓冲区中的数据块,并利用多线程的方法对该数据块进行并行压缩编码,将压缩编码后的数据存入输出缓冲区;写入步骤,合并输出缓冲区中各个进程并行压缩编码后的数据,并将所述合并后的数据写入输出文件中。该方法在取得理想的压缩比的同时,大大降低压缩过程对时间的开销,能够很好的应用于云存储或数据库系统中,解决压缩实时性不高的问题,提高了压缩的整体性能。
申请公布号 CN103326730A 申请公布日期 2013.09.25
申请号 CN201310223858.X 申请日期 2013.06.06
申请人 清华大学 发明人 付昊桓;甘霖;魏腾鹏;王英侨;黄小猛;杨广文
分类号 H03M7/30(2006.01)I 主分类号 H03M7/30(2006.01)I
代理机构 深圳市鼎言知识产权代理有限公司 44311 代理人 徐丽昕
主权项 一种数据并行压缩方法,其特征在于,该方法包括:读取步骤,通过并行I/O从存储装置中读取待压缩数据;切分步骤,将待压缩数据均匀切分成N个数据块,并将所述N个数据块保存至每个数据块所对应的输入缓冲区;压缩编码步骤,每个进程控制对应的输入缓冲区中的数据块,并利用多线程的方法对该数据块进行并行压缩编码,将压缩编码后的数据存入输出缓冲区;写入步骤,合并输出缓冲区中各个进程并行压缩编码后的数据,将所述合并后的数据写入输出文件中。
地址 100084 北京市海淀区北京100084-82信箱