发明名称 |
死链规则挖掘方法和装置以及搜索方法和装置 |
摘要 |
本发明公开了一种死链规则挖掘方法和装置以及一种搜索方法、装置,该方法包括:基于已抓取链接列表,选择指定站点中链接,获取该指定站点中链接所包含的各级目录链接;对于各目录链接,分别统计各自对应的死链属性,以及分别统计各自对应的死链属性的扩展性;基于上述各个目录链接分别对应的死链属性以及死链属性的扩展性,确定所述指定站点的死链规则。本发明提供的技术方案不再局限于对链接的死链属性的遍历式检测,而是进一步通过分析其死链属性和死链属性的扩展性,挖掘死链规则,克服了现有技术的盲目和繁琐,更加启发式、有效、便捷地对指定站点中的链接属性进行判断;并给用户提供更为有效、可靠的搜索体验。 |
申请公布号 |
CN104572928B |
申请公布日期 |
2016.06.22 |
申请号 |
CN201410836517.4 |
申请日期 |
2014.12.29 |
申请人 |
奇飞翔艺(北京)软件有限公司 |
发明人 |
郑燕琴 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市隆安律师事务所 11323 |
代理人 |
权鲜枝;何立春 |
主权项 |
一种死链规则挖掘方法,其中,该方法包括:基于已抓取链接列表,选择指定站点中链接,获取该指定站点中链接所包含的各级目录链接;对于各目录链接,分别统计各自对应的死链属性,以及分别统计各自对应的死链属性的扩展性;基于上述各个目录链接分别对应的死链属性以及死链属性的扩展性,确定所述指定站点的死链规则。 |
地址 |
100015 北京市朝阳区酒仙桥路6号院2号楼A座5层501-506室 |