发明名称 数据处理系统和方法
摘要 一种用于从n个项目的数据库检索k个项目的子集(n>>k)的数据处理方法和系统,首先确定在所述数据库内的bk(b>1)个项目的有限子集,所述项目按照给定的相似性函数S而与输入的查询t具有最大相似性。然后通过下列方式来建立结果子集:将与查询t具有最高相似性S的那个项目来作为第一成员;循环地选择作为具有最高品质Q的bk个项目中的剩余项目的子集的每个接续成员,其中Q是针对输入的查询t的相似性S和相对于已经在结果子集中的项目的相对多样性RD的给定函数。以这种方式,结果子集的多样性相对于k个对查询t的最相似项目的简单选择被大大地提高,而仅仅在处理要求中有适度的额外增加。
申请公布号 CN1537290A 申请公布日期 2004.10.13
申请号 CN02815097.X 申请日期 2002.07.30
申请人 都柏林大学 发明人 巴里·J·史密斯
分类号 G06F17/30;G06F17/60 主分类号 G06F17/30
代理机构 北京市柳沈律师事务所 代理人 马莹;邵亚丽
主权项 1.一种数据处理方法,用于从n个项目的数据库检索k个项目的子集(n>>k),所述方法包括:(a)确定在n个项目的数据库中的bk(b>1)个项目,所述n个项目按照给定的相似性函数S而与输入的查询t具有最大相似性;(b)选择与查询t具有最高相似性S的在bk个项目中的那个项目来作为子集的第一成员;(c)循环地选择作为具有最高品质Q的bk个项目中的剩余项目的子集中的每个接续成员,其中Q是针对输入的查询t的相似性S和相对多样性RD的给定函数,其中相对的多样性RD是对于在前面的循环期间所选择的项目中的那个剩余项目的给定多样性函数。
地址 爱尔兰都柏林