发明名称 一种对海量热点页面筛选排序的算法
摘要 本发明公开了一种对海量热点页面(URL)筛选排序的算法,属于计算机数据处理领域。本算法总模块,包括排名模块(3),设置有统计采样模块(1)和筛选模块(2);该算法按照统计采样模块(1)、筛选模块(2)、排名模块(3)依次进行;所述的统计采样模块(1)包括统计子模块(1.1)和采样子模块(1.2);所述的筛选模块(2)包括依次进行的预估子模块(2.1)、首次筛选子模块(2.2)、再次筛选子模块(2.3)和调整筛选子模块(2.4)。运用此算法可以高效实现从现网的站点页面中按排名要求筛选出相应的热点站点页面,并在此基础上对选中的站点页面进行排序。
申请公布号 CN101414308A 申请公布日期 2009.04.22
申请号 CN200810197813.9 申请日期 2008.11.24
申请人 武汉虹旭信息技术有限责任公司 发明人 敖伟成;叶猛;李磊
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 武汉宇晨专利事务所 代理人 黄瑞棠
主权项 1、一种用于记录统计信息的统计表组织结构,其特征在于:统计表使用hash+rb_tree构造,即主表是hash,在每个bucket中使用一个rb_tree来组织统计节点,用于保存总的统计指标信息及各统计项的关键信息。
地址 430074湖北省武汉市洪山区邮科院路88号