发明名称 一种近似的海量地址数据最近邻查询方法
摘要 本发明一种近似的海量地址数据最近邻查询方法,属于数据挖掘领域,本发明在人们并不需要精确的查询结果,仅需要满足一定精度要求的近似查询结果时,适当损失查询精度,以一种更快速的反应速度对用户的查询做出应答;同时若用户希望得到一个非近似的、精确的查询结果集时,本方法依然可以对此类要求做出应答。
申请公布号 CN103995871A 申请公布日期 2014.08.20
申请号 CN201410217378.7 申请日期 2014.05.22
申请人 东北大学 发明人 宋杰;徐澍;李甜甜;朱志良
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 沈阳东大知识产权代理有限公司 21109 代理人 梁焱
主权项 一种近似的海量地址数据最近邻查询方法,其特征在于,包括以下步骤:步骤1、通过GPRS系统查询获得用户所在位置周围的所有目标地址;步骤2、根据实际需求设定垂直距离和水平距离的权值;步骤3、计算加权值,即将垂直距离乘以其权值获得的结果与水平距离乘以其权值获得的结果相加;步骤4、根据实际需求设置查询条件,包括查询目标地址个数、查询误差和确定查询算法;步骤5、判断设置的查询条件是否满足约束条件,具体为:约束1:查询目标地址个数小于或等于GPRS系统中查询的目标地址总数;约束2:查询误差大于或等于零;约束3:查询算法为近似KNN算法;若同时满足约束1~约束3,则执行步骤6;若同时满足约束1和约束2,则执行步骤12;若同时不满足约束1~约束3,则返回执行步骤4进行重新设置;步骤6、将GPRS系统中记录的所有目标地址按照记录顺序进行分组,每组的地址个数为查询目标地址个数;步骤7、判断分组后的每组实际地址个数是否均大于设置的查询目标地址个数,若是,则执行步骤8,否则,从未满足条件的组的第一条地址记录起向前查找地址,作为该组的地址进行补充,直至该组地址个数达到设置的查询目标地址个数,执行步骤8;步骤8、随机选取每组中一个地址作为代表数据,并在每组中选择另一个地址数据,计算该地址数据与代表数据之间的加权值差值;步骤9、判断上述加权值差值的绝对值是否超过用户设定的四分之一倍的查询误差,若超过,则返回执行步骤4重新设置查询误差,否则,继续选择每组中的其他地址数据进行计算判断,直至完成每组中的所有地址数据的比较判断,执行步骤10;步骤10、采用最近邻查询算法根据每组中的代表数据进行计算,获得所有代表数据中一个距离最近的地址;步骤11、将距离最近的代表数据所在的分组中所有地址输出显示,完成用户的地址查询;步骤12、直接采用最近邻查询算法对GPRS系统所查询的所有目标地址进行计算,获得距离用户最近的地址。
地址 110819 辽宁省沈阳市和平区文化路3号巷11号