发明名称 一种自动处理网页文本的内链的方法及装置
摘要 本发明提供了一种自动处理网页文本的内链的方法,包括步骤:a.获取用户行为日志;b.根据所述行为日志统计所述网页文本的点击数据;c.根据所述点击数据判断所述网页文本是否满足删除条件,以得到待删除内链的网页文本集合,d.从所述网页文本集合中的子文本的所有内链中抓取出低质量的内链;e.删除所述低质量的内链。通过上述方式,大大节省了人工成本,减少了内链处理行为的主观性,并且很好地提高了文本内链的质量,改善了文本内链对用户的引导效果。
申请公布号 CN102654875A 申请公布日期 2012.09.05
申请号 CN201110052159.4 申请日期 2011.03.04
申请人 北京百度网讯科技有限公司 发明人 李永强;耿磊;严冰;李忠红;刘晓东;苏上海;闫江波;田孟月
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市威世博知识产权代理事务所(普通合伙) 44280 代理人 何青瓦;李庆波
主权项 一种自动处理网页文本的内链的方法,其特征在于,所述方法包括步骤:a.获取用户行为日志;b.根据所述行为日志统计所述网页文本的点击数据;c.根据所述点击数据判断所述网页文本是否满足删除条件,以得到待删除内链的网页文本集合,d.从所述网页文本集合中的子文本的所有内链中抓取出低质量的内链;e.删除所述低质量的内链。
地址 100085 北京市海淀区上地十街10号百度大厦2层