发明名称 PDF文件对比方法及系统
摘要 本发明公开了一种PDF文件对比方法及系统,涉及计算机领域。所述方法包括:提取第一PDF文件中的一个剩余段落作为目标段落;判断第二PDF文件中预定范围内是否存在剩余段落,如果存在,在预定范围内匹配得到目标段落的最相似段落,移除目标段落和最相似段落;否则,移除目标段落;在所述目标段落所在的页转换的计算机呈现载体中标识所述目标段落和所述最相似段落相同的文字;在所述最相似段落所在的页转换的计算机呈现载体中标识所述目标段落和所述最相似段落相同的文字;判断所述第一PDF文件是否存在剩余段落,如果存在,执行第一步;否则,输出第一PDF文件和第二PDF文件对应的计算机呈现载体。所述方法及系统提高了PDF文件的对比效率和对比准确度。
申请公布号 CN103412905A 申请公布日期 2013.11.27
申请号 CN201310329900.6 申请日期 2013.07.31
申请人 广联达软件股份有限公司 发明人 张树坤;周剑
分类号 G06F17/30(2006.01)I;G06F17/22(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 王莹
主权项 一种便携文件格式PDF文件对比方法,其特征在于,包括:110:提取第一PDF文件中的一个剩余段落作为目标段落;120:判断第二PDF文件中预定范围内是否存在剩余段落,如果存在,在所述预定范围内匹配得到所述目标段落的最相似段落,移除所述目标段落和所述最相似段落;否则,移除所述目标段落;130:判断所述目标段落所在的页是否已转换为计算机呈现载体,如果是,在所述目标段落所在的页转换的计算机呈现载体中标识所述目标段落和所述最相似段落相同的文字,否则,将所述目标段落所在的页转换为计算机呈现载体,在所述目标段落所在的页转换的计算机呈现载体中标识所述目标段落和所述最相似段落相同的文字;140:判断所述最相似段落所在的页是否已转换为计算机呈现载体,如果是,在所述最相似段落所在的页转换的计算机呈现载体中标识所述目标段落和所述最相似段落相同的文字,否则,将所述最相似段落所在的页转换为计算机呈现载体,在所述最相似段落所在的页转换的计算机呈现载体中标识所述目标段落和所述最相似段落相同的文字;150:判断所述第一PDF文件是否存在剩余段落,如果存在,执行所述步骤110;否则,输出所述第一PDF文件和所述第二PDF文件对应的计算机呈现载体。
地址 100193 北京市海淀区东北旺西路8号中关村软件园甲18号楼广联达大厦