发明名称 |
基于域名解析特征的网站作弊检测方法 |
摘要 |
本发明涉及基于域名解析特征的网站作弊检测方法,其步骤为:对取样出的样本网站进行分类得到训练集L和测试集T,提取出所述训练集L和测试集T中网站的特征向量;特征向量包括解析量和独立IP访问页数和基于所述解析量和独立IP访问页数的变换率向量、出入链接平均数向量和出入链接方差向量确定的多维向量;在所述训练集L中建立每个网站的多维向量形式,根据分类算法训练网站作弊分类器,建立判别模型;用户输入待检测网站后利用所述判别模型对待检测网站进行判定,输出作弊或非作弊结果给用户。本发明充分利用作弊网站以提升流量为目标的特点,以解析数据为核心的特征,并在该特征空间上训练分类器,利用该分类器对未知样本进行作弊与否的判定。 |
申请公布号 |
CN103684896A |
申请公布日期 |
2014.03.26 |
申请号 |
CN201210333167.0 |
申请日期 |
2012.09.07 |
申请人 |
中国科学院计算机网络信息中心 |
发明人 |
耿光刚;王利明;胡安磊 |
分类号 |
H04L12/26(2006.01)I;H04L29/12(2006.01)I |
主分类号 |
H04L12/26(2006.01)I |
代理机构 |
北京君尚知识产权代理事务所(普通合伙) 11200 |
代理人 |
余长江 |
主权项 |
基于域名解析特征的网站作弊检测方法,其步骤为:1)对样本网站进行分类得到训练集L和测试集T;2)提取出所述训练集L和测试集T中网站的特征向量;所述特征向量包括解析量、独立IP访问页数、基于所述解析量和独立IP访问页数的变换率向量、出入链接平均数向量和出入链接方差向量确定的多维向量;3)在所述训练集L中建立每个网站的多维向量形式,根据分类算法训练网站作弊分类器,建立判别模型;4)利用所述判别模型对用户输入的待检测网站进行检测,确定是否存在作弊行为。 |
地址 |
100190 北京市海淀区中关村南四街4号 |