发明名称 大规模数据信息排重处理系统
摘要 本发明涉及的是一种信息处理技术领域的大规模数据信息排重处理系统,包括输入模块、数字编码模块、多点检验模块、输出模块,输入模块接收需要进行排重的原始数据,即数据实例;数字编码模块将输入模块获得的数据实例进行重新编码,将数据空间压缩到与待解问题实际数据实例的规模相当或稍大的空间;多点检验模块对新编码进行多次采样,并与高速存储的地址建立映射关系,通过控制高速存储相应地址的标志位来记录是否已经出现过某一个数据实例,从而实现排重功能;输出模块将经过排重的数据返回给用户。本发明具有高效性及可处理数据量大等特点。
申请公布号 CN101414309A 申请公布日期 2009.04.22
申请号 CN200810203439.9 申请日期 2008.11.27
申请人 上海交通大学 发明人 韩定一;周云庆;袁若石;薛贵荣;俞勇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海交达专利事务所 代理人 王锡麟;王桂忠
主权项 1、一种大规模数据信息排重处理系统,其特征在于包括四个模块:输入模块、数字编码模块、多点检验模块、输出模块,其中:所述的输入模块接收需要进行排重的原始数据,即数据实例;所述的数字编码模块将输入模块获得的数据实例进行重新编码,将数据空间压缩到与待解问题实际数据实例的规模相当或稍大的空间;所述的多点检验模块对新编码进行多次采样,并与高速存储的地址建立映射关系,通过控制高速存储相应地址的标志位来记录是否已经出现过某一个数据实例,从而实现排重;所述的输出模块将经过排重的数据返回给用户。
地址 200240上海市闵行区东川路800号