发明名称 基于域名解析特征的网站作弊检测方法
摘要 本发明涉及基于域名解析特征的网站作弊检测方法,其步骤为:对取样出的样本网站进行分类得到训练集L和测试集T,提取出所述训练集L和测试集T中网站的特征向量;特征向量包括解析量和独立IP访问页数和基于所述解析量和独立IP访问页数的变换率向量、出入链接平均数向量和出入链接方差向量确定的多维向量;在所述训练集L中建立每个网站的多维向量形式,根据分类算法训练网站作弊分类器,建立判别模型;用户输入待检测网站后利用所述判别模型对待检测网站进行判定,输出作弊或非作弊结果给用户。本发明充分利用作弊网站以提升流量为目标的特点,以解析数据为核心的特征,并在该特征空间上训练分类器,利用该分类器对未知样本进行作弊与否的判定。
申请公布号 CN103684896A 申请公布日期 2014.03.26
申请号 CN201210333167.0 申请日期 2012.09.07
申请人 中国科学院计算机网络信息中心 发明人 耿光刚;王利明;胡安磊
分类号 H04L12/26(2006.01)I;H04L29/12(2006.01)I 主分类号 H04L12/26(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 11200 代理人 余长江
主权项 基于域名解析特征的网站作弊检测方法,其步骤为:1)对样本网站进行分类得到训练集L和测试集T;2)提取出所述训练集L和测试集T中网站的特征向量;所述特征向量包括解析量、独立IP访问页数、基于所述解析量和独立IP访问页数的变换率向量、出入链接平均数向量和出入链接方差向量确定的多维向量;3)在所述训练集L中建立每个网站的多维向量形式,根据分类算法训练网站作弊分类器,建立判别模型;4)利用所述判别模型对用户输入的待检测网站进行检测,确定是否存在作弊行为。
地址 100190 北京市海淀区中关村南四街4号