发明名称 |
在搜索引擎中处理悬空网页节点的方法和系统 |
摘要 |
本发明公开了一种在搜索引擎中处理悬空网页节点的方法,包括步骤:从互联网上获取网页的同时获取所述网页的从属网站信息;判断所述网页是否为悬空网页,如果是则在计算所述网页的等级时执行步骤:为所述悬空网页增加到至少一个非悬空网页的虚拟出链;该非悬空网页与所述悬空网页从属于同一个网站。本发明还公开了一种在搜索引擎中处理悬空网页节点的系统。本发明通过为每个悬空网页节点增加其站内虚拟链接,有利于pagerank的计算,使悬空节点的pagerank计算合理化,提高搜索引擎搜索结果的质量。 |
申请公布号 |
CN100489859C |
申请公布日期 |
2009.05.20 |
申请号 |
CN200710073597.2 |
申请日期 |
2007.03.21 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
文勖 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市顺天达专利商标代理有限公司 |
代理人 |
郭伟刚;蔡晓红 |
主权项 |
1、在搜索引擎中处理悬空网页节点的方法,其特征在于,包括以下步骤:A1,从互联网上获取网页的同时获取所述网页的从属网站信息;A2,判断所述网页是否为悬空网页,如果是则在计算所述网页的等级时执行步骤B1;B1,为所述悬空网页增加到至少一个非悬空网页的虚拟出链以消除悬空节点;所述非悬空网页与所述悬空网页从属于同一个网站。 |
地址 |
518057广东省深圳市高新科技园南区高新南一道飞亚达高科技大厦5-10层 |