发明名称 一种基于局部敏感哈希的聚类索引方法及系统
摘要 发明涉及一种基于局部敏感哈希的聚类索引方法及系统,所述方法包括:步骤1,对数据集进行聚类分析,将数据集分成若干个类,并确定和保存每个类的聚类中心;步骤2,在每个类中采用局部敏感哈希方法建立哈希表;步骤3,计算各聚类中心与查询点之间的欧式距离,选择距离最小的多个类作为候选类;步骤4,计算查询点在每个候选类中的哈希值,根据步骤2建立的哈希表,选出候选类中与查询点哈希值相同的数据点作为候选点;步骤5,计算候选点与查询点之间的欧式距离,将欧式距离最小的候选点作为查询点的最近邻点。本发明可以在牺牲较小准确率的情况下换取查询效率的较大提高和查询性能的相对稳定。
申请公布号 CN103631928A 申请公布日期 2014.03.12
申请号 CN201310652980.9 申请日期 2013.12.05
申请人 中国科学院信息工程研究所 发明人 谢洪涛;王鹏;徐克付;谭建龙
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京轻创知识产权代理有限公司 11212 代理人 杨立
主权项 一种基于局部敏感哈希的聚类索引方法,其特征在于,包括:步骤1,对数据集进行聚类分析,将数据集分成若干个类,并确定和保存每个类的聚类中心;步骤2,在每个类中采用局部敏感哈希方法建立哈希表;步骤3,计算各聚类中心与查询点之间的欧式距离,选择距离最小的多个类作为候选类;步骤4,计算查询点在每个候选类中的哈希值,根据步骤2建立的哈希表,选出候选类中与查询点哈希值相同的数据点作为候选点;步骤5,计算候选点与查询点之间的欧式距离,将欧式距离最小的候选点作为查询点的最近邻点。
地址 100093 北京市海淀区闵庄路甲89号
您可能感兴趣的专利