发明名称 |
一种识别作弊网页的方法及系统 |
摘要 |
本发明公开了一种识别作弊网页的方法及系统,以解决目前判断作弊网页的方法准确度不高,耗费时间和人工,处理流程繁琐,不能及时地发现作弊网页,处理效率比较低的问题。所述方法包括:分析作弊网页的内容,获取作弊网页的结构特征;对作弊网页的结构特征进行统计,分析得出作弊规律;利用所述作弊规律对网页进行作弊识别。本发明主要针对利用重复关键词进行作弊的网页,由于利用已有的作弊规律来识别网页,因此能够更准确地识别出作弊网页。而且,由于识别的准确度提高,所以完全可以由机器来完成,不需要人工配合,因此极大地提高了识别效率。 |
申请公布号 |
CN101777053A |
申请公布日期 |
2010.07.14 |
申请号 |
CN200910076553.4 |
申请日期 |
2009.01.08 |
申请人 |
北京搜狗科技发展有限公司 |
发明人 |
张智敏;王静帆 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
逯长明 |
主权项 |
一种识别作弊网页的方法,其特征在于,包括:分析作弊网页的内容,获取作弊网页的结构特征;对作弊网页的结构特征进行统计,分析得出作弊规律;利用所述作弊规律对网页进行作弊识别。 |
地址 |
100084北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |