发明名称 |
网页识别方法及网页识别装置 |
摘要 |
本发明提供一种网页识别方法及网页识别装置,该网页识别方法包括根据预定词汇数据库,获取网页标题中的预定词汇;根据预定词汇数据库中的预定词汇的加权值,生成网页标题的第一识别值;以及根据预设的第一阈值和网页标题的第一识别值,对网页标题的所属网页进行预定网页的识别。本发明还提供一种网页识别装置。本发明的网页识别方法及网页识别装置通过对网页标题中的预定词汇进行识别,实现了对“作弊”网页的识别。 |
申请公布号 |
CN104933055A |
申请公布日期 |
2015.09.23 |
申请号 |
CN201410100694.6 |
申请日期 |
2014.03.18 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
蔡兵 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳翼盛智成知识产权事务所(普通合伙) 44300 |
代理人 |
刁文魁;唐秀萍 |
主权项 |
一种网页识别方法,其特征在于,包括:根据预定词汇数据库,获取网页标题中的预定词汇,所述预定词汇数据库包括所述预定词汇以及与所述预定词汇对应的加权值;根据所述预定词汇数据库中的预定词汇的加权值,生成所述网页标题的第一识别值;以及根据预设的第一阈值和所述网页标题的第一识别值,对所述网页标题的所属网页进行预定网页的识别。 |
地址 |
518000 广东省深圳市福田区振兴路赛格科技园2栋东403室 |