发明名称 未残缺JPEG文件碎片重组的方法
摘要 本发明公开了一种未残缺JPEG文件碎片重组方法,首先,在存储介质上提取并确定出JPEG文件碎片数据;然后获得JPEG文件头信息,并根据所述JPEG文件头信息对所述JPEG文件碎片数据按照JPEG的文件类型进行解码,得到多个待分析的JPEG文件碎片数据块;之后,利用相似度模型得到两个数据块的相似度,根据相似度将相邻的数据块连接起来形成JPEG文件;最后利用每个数据块的MCU差异度diffmcu判断该数据块是否属于当前的JPEG文件,如果不属于,删除,如果属于,则保留,保留下来的连接在一起的多个数据块组成了一个完整的JPEG文件。通过上述方法可以准确地将文件碎片重组为完整的JPEG文件。
申请公布号 CN102682024B 申请公布日期 2014.02.05
申请号 CN201110062119.8 申请日期 2011.03.11
申请人 中国科学院高能物理研究所 发明人 肖腾;杨泽明;刘宝旭
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京信慧永光知识产权代理有限责任公司 11290 代理人 王月玲;武玉琴
主权项 1.一种未残缺JPEG文件碎片重组方法,其体征在于:包括以下步骤:步骤1:在存储介质上提取并确定出JPEG文件碎片数据;步骤2:获得JPEG文件头信息,并根据所述JPEG文件头信息对所述JPEG文件碎片数据按照JPEG的文件类型进行解码,得到多个待分析的JPEG文件碎片数据块;步骤3:利用相似度模型的公式(1)得到两个数据块的相似度,根据相似度将相邻的数据块连接起来形成JPEG文件;<maths num="0001"><![CDATA[<math><mrow><msub><mi>diff</mi><mi>pix</mi></msub><mo>=</mo><msqrt><msup><msub><mi>R</mi><mi>d</mi></msub><mn>2</mn></msup><mo>+</mo><msup><msub><mi>G</mi><mi>d</mi></msub><mn>2</mn></msup><mo>+</mo><msup><msub><mi>B</mi><mi>d</mi></msub><mn>2</mn></msup></msqrt></mrow></math>]]></maths>   公式(1)其中,R<sub>d</sub>、G<sub>d</sub>、B<sub>d</sub>分别为两个相邻数据块边缘的像素R、G、B之间的差值,其中,diff<sub>pix</sub>为边缘像素的相似度;步骤4:利用每个数据块的MCU差异度diff<sub>mcu</sub>判断该数据块是否属于当前的JPEG文件,如果不属于,删除,如果属于,则保留,保留下来的连接在一起的多个数据块组成了一个完整的JPEG文件;步骤4中的利用每个数据块的MCU差异度diff<sub>mcu</sub>判断该数据块是否属于当前的JPEG文件具体包括以下步骤:步骤41,通过公式(2)计算该数据块的MCU的差异度diff<sub>mcu</sub>,<maths num="0002"><![CDATA[<math><mrow><msub><mi>diff</mi><mi>mcu</mi></msub><mo>=</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover></msqrt><msub><msup><mi>diff</mi><mn>2</mn></msup><msub><mi>pix</mi><mi>i</mi></msub></msub></mrow></math>]]></maths>   公式(2)其中,diff<sub>pix</sub>为边缘像素的相似度,i是diff<sub>pix</sub>变量的下标;步骤42,判断该数据块的一个MCU的差异度diff<sub>mcu</sub>是否小于阀值δ<sup>-</sup>,如果小于,则确定该数据块属于当前的JPEG文件,如果该MCU的差异度diff<sub>mcu</sub>不小于阀值δ<sup>-</sup>,则执行步骤43;步骤43,判断该MCU的差异度diff<sub>mcu</sub>是否大于阀值δ<sup>+</sup>,如果大于,则确定该数据块不属于当前的JPEG文件,如果该MCU的差异度diff<sub>mcu</sub>不大于阀值δ<sup>-</sup>,进入步骤44;步骤44,计算出该数据块所有MCU的差异度的平均值<img file="FDA0000393311620000013.GIF" wi="81" he="82" />如果该平均值<img file="FDA0000393311620000014.GIF" wi="55" he="78" />小于阀值δ<sup>-</sup>,则确定该数据块属于当前的JPEG文件;如果该平均值<img file="FDA0000393311620000015.GIF" wi="58" he="78" />大于阀值δ<sup>+</sup>,则确定该数据块不属于当前的JPEG文件;如果该平均值<img file="FDA0000393311620000016.GIF" wi="47" he="78" />大于阀值δ<sup>-</sup>且小于阀值δ<sup>+</sup>,则标记为不确定,并重复执行步骤41-44,如果该数据块中所有MCU的差异度均为不确定,则该数据块不属于当前的JPEG文件。
地址 100049 北京市玉泉路19号(乙)