发明名称 数据压缩方法与装置
摘要 一种数据压缩方法,包括:藉由接收单元,获得来自相同来源的第一读出序列与第二读出序列;藉由处理器,根据比较条件比较第一读出序列与第二读出序列以产生序列比较结果;藉由处理器,根据序列比较结果输出最终模板序列;藉由处理器,比较最终模板序列和第一读出序列,以及比较最终模板序列该第二读出序列,分别产生最终模板序列和第一读出序列、第二读出序列的差异值;以及藉由处理器,根据最终模板序列和第一读出序列、第二读出序列的差异值,压缩第一读出序列和第二读出序列,以产生压缩档案。
申请公布号 CN102576388B 申请公布日期 2014.10.08
申请号 CN201080029716.4 申请日期 2010.12.23
申请人 财团法人工业技术研究院 发明人 黄百纲;范振业;邱创汎
分类号 G06F19/22(2006.01)I;C12Q1/68(2006.01)I 主分类号 G06F19/22(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 陈小雯
主权项 一种数据压缩方法,包括:(a)藉由接收单元,获得来自一相同来源的第一读出序列与第二读出序列;(b)藉由处理器,根据比较条件比较该第一读出序列与该第二读出序列以产生序列比较结果;(c)藉由该处理器,根据该序列比较结果输出最终模板序列;(d)藉由该处理器,比较该最终模板序列和该第一读出序列,以及比较该最终模板序列和该第二读出序列,分别产生该最终模板序列和该第一读出序列、该第二读出序列的差异值;以及(e)藉由该处理器,根据该最终模板序列和该第一读出序列、该第二读出序列的上述差异值,压缩该第一读出序列和该第二读出序列,以产生压缩档案,其中该比较条件系根据该第一读出序列之第一序列子集目录与该第二读出序列之第二序列子集目录来设定,该第一读出序列的该第一序列子集目录包括复数个具有特定长度的第一序列子集,该复数个第一序列子集构成复数个具有不同序列子集起始位置的第一序列子集组,且该第二读出序列的该第二序列子集目录包括复数个具有特定长度的第二序列子集,该复数个第二序列子集构成复数个具有不同序列子集起始位置的第二序列子集组,且其中该第一序列子集目录之该第一序列子集的该特定长度与该第二序列子集目录之该第二序列子集的该特定长度为相同之特定长度;其中该步骤(b)包括:比较该第一序列子集目录与该第二序列子集目录以产生共同片段与非共同的区域,其中一个共同片段由至少一个共同的序列子集所构成且无间断的介于两个非共同的区域之间,又该共同片段越长,则包含于其中之该共同的序列子集的数量越多,且其中藉由比较该第一序列子集目录与该第二序列子集目录所产生的所有共同片段形成共同片段组合;测定该共同片段组合对该第一读出序列或该第二读出序列的覆盖率;以及当该覆盖率的值满足预定值时,自该共同片段组合产生该序列比较结果。
地址 中国台湾新竹县