发明名称 |
数据重复性检查方法 |
摘要 |
一种数据重复性检查方法,该方法包括:确定与第一要素相关的至少一个第二要素,其中数据包含多个第一要素和多个第二要素;对应于每个第一要素生成包含第二要素的第一集合,其中所生成的每个第一集合包含与一个第一要素相关的全部第二要素;检查对应于第一集合中每个第二要素的数据中是否存在与待查数据相同的重复数据;以及输出检查结果。通过上述技术方案,利用数据中的要素对待检查的数据进行分类能够利用根据单一要素建立的集合对待查数据进行检查,实现对重复数据的快速检查。 |
申请公布号 |
CN106202134A |
申请公布日期 |
2016.12.07 |
申请号 |
CN201510290774.7 |
申请日期 |
2015.05.30 |
申请人 |
中国石油化工股份有限公司;中国石油化工股份有限公司石油物探技术研究院 |
发明人 |
洪承煜;杨尚琴;陈浩;岳承琪;王昀;吴边 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京思创毕升专利事务所 11218 |
代理人 |
刘明华 |
主权项 |
一种数据重复性检查方法,其特征在于,该方法包括:确定与第一要素相关的至少一个第二要素,其中所述数据包含多个所述第一要素和多个所述第二要素;对应于每个第一要素生成包含第二要素的第一集合,其中所生成的每个第一集合包含与一个第一要素相关的全部第二要素;检查对应于第一集合中每个第二要素的数据中是否存在与待查数据相同的重复数据;以及输出检查结果。 |
地址 |
100728 北京市朝阳区朝阳门北大街22号 |