发明名称 一种非合作环境下的资源选择方法
摘要 本发明公开了一种非合作环境下的资源选择方法,本发明在非合作环境中利用基于相关度的资源选择方法,计算出每个资源的相关度并排序,得到一个依据相关度排序的资源列表;通过指纹提取技术从每个资源中提取覆盖统计信息,并利用布隆过滤器进行压缩;采用基于查询关键词语义的分发策略进行高效存储和检索;然后通过比较布隆过滤器来比较相应指纹集的重叠度,从而获取每个资源的新颖度;然后计算每个资源的新颖度,并根据新颖度重新调整候选资源的排列顺序;最后,利用相关度和新颖度进行加权运算,得到最优资源列表。本发明在资源选择时兼顾资源相关度和重叠程度,提高了查询的效率。
申请公布号 CN102609536A 申请公布日期 2012.07.25
申请号 CN201210035195.4 申请日期 2012.02.16
申请人 杭州电子科技大学 发明人 任祖杰;徐向华;万健;张纪林;蒋从锋;任永坚
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 一种非合作环境下的资源选择方法,其特征在于:在资源选择时兼顾资源相关度和重叠程度,从而提高查询的效率,该方法采用以下步骤实现:步骤1:首先利用基于相关度的资源选择方法,计算出每个资源相关度并排序,得到一个依据资源相关度排序的资源列表;步骤2:从查询结果中获取结果文档的指纹集;假定一个资源组<P1,P2…Pi…Pn>,并假定一个节点产生一个查询Q,当节点收到返回结果后,对每个结果文档,利用指纹提取技术提取出一串固定长度的数字来表示一个结果文档的标题内容;步骤3:管理覆盖统计信息;这个过程包含了三个子过程:从结果指纹集中提取覆盖统计信息的过程、覆盖统计信息的存储过程、覆盖统计信息检索的过程;所述的管理包含两类操作:存储和检索;当一组覆盖统计信息产生后,系统需要根据覆盖统计信息中查询的语义,分发到系统的各个资源中进行存储,方便覆盖统计信息的检索;步骤4:计算每个资源的新颖度;根据给定一组资源及其覆盖统计信息,计算出每个资源含新颖结果的数量,进而计算出每个资源对查询结果的新颖度;步骤5:根据步骤1中计算得出的资源相关度,结合新颖度对资源排序的列表进行调整,使得新颖结果数量最大化。
地址 310018 浙江省杭州市下沙高教园区2号大街