发明名称 用于聚焦爬行的导航排名
摘要 公开了用于聚焦爬行的导航排名的系统和方法。在一示例性实施例中,一种方法可包括使用分类器来将至少一个目标网页与网站上的其它网页区分开来。该方法还可包括通过有向图G=(V,E)来对网站上的网页建模,其中每一个网页都由顶点(V)表示,而两个网页之间的链接由边(E)表示。该方法还可包括基于分类器来为V中的每一个网页(u)分配权重p(u)以计算指示网页的相关性的导航排名。
申请公布号 CN101855631B 申请公布日期 2016.06.29
申请号 CN200780101491.7 申请日期 2007.11.08
申请人 上海惠普有限公司;惠普发展公司,有限责任合伙企业 发明人 张立;冯是聪;熊宇红
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 归莹;罗正云
主权项 一种用于聚焦爬行的导航排名的方法,包括:使用分类器来将至少一个目标网页与网站上的其它网页区分开来;通过有向图G=(V,E)来对所述网站上的网页建模,其中每一个网页都由顶点(V)表示,而两个网页之间的链接由边(E)表示;以及基于分类器来为V中的每一个网页(u)分配权重p(u)以计算指示网页通向目标网页的可能性的度量的导航排名,其中所述导航排名根据静态模型来计算,并且基于为生成所述网站的图而从所述网站下载的所有网页来根据所述静态模型计算所述导航排名;并且其中计算所述导航排名使用平均方法。
地址 100022 北京市建国路112号惠普大厦