发明名称 死链规则挖掘方法和装置以及搜索方法和装置
摘要 本发明公开了一种死链规则挖掘方法和装置以及一种搜索方法、装置,该方法包括:基于已抓取链接列表,选择指定站点中链接,获取该指定站点中链接所包含的各级目录链接;对于各目录链接,分别统计各自对应的死链属性,以及分别统计各自对应的死链属性的扩展性;基于上述各个目录链接分别对应的死链属性以及死链属性的扩展性,确定所述指定站点的死链规则。本发明提供的技术方案不再局限于对链接的死链属性的遍历式检测,而是进一步通过分析其死链属性和死链属性的扩展性,挖掘死链规则,克服了现有技术的盲目和繁琐,更加启发式、有效、便捷地对指定站点中的链接属性进行判断;并给用户提供更为有效、可靠的搜索体验。
申请公布号 CN104572928B 申请公布日期 2016.06.22
申请号 CN201410836517.4 申请日期 2014.12.29
申请人 奇飞翔艺(北京)软件有限公司 发明人 郑燕琴
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市隆安律师事务所 11323 代理人 权鲜枝;何立春
主权项 一种死链规则挖掘方法,其中,该方法包括:基于已抓取链接列表,选择指定站点中链接,获取该指定站点中链接所包含的各级目录链接;对于各目录链接,分别统计各自对应的死链属性,以及分别统计各自对应的死链属性的扩展性;基于上述各个目录链接分别对应的死链属性以及死链属性的扩展性,确定所述指定站点的死链规则。
地址 100015 北京市朝阳区酒仙桥路6号院2号楼A座5层501-506室