发明名称 一种商用网页恶意篡改检测方法
摘要 本发明提供一种商用网页恶意篡改检测方法,包括篡改学和篡改检测两部分,篡改学的步骤为:下载商用网页的图像组成正样本,下载非商用网页图像组成负样本,然后提取并级联图像的颜色直方图和灰度梯度直方图特征,得到总矢量特征,再利用支持向量机分类器对总矢量特征进行训练;篡改检测步骤为:按照与篡改学相同的步骤,下载商用网页的图像,并提取图像的颜色直方图和灰度梯度直方图特征,利用系统训练已训练的支持向量机分类器进行图像属性的判决,完成网页的有效性判决。本发明能克服传统网页篡改检测只能静态检测的缺点,检测过程区分合理篡改和恶意篡改,完成动态网页监控,此方法框架结构简单,扩展性强。
申请公布号 CN102169533A 申请公布日期 2011.08.31
申请号 CN201110120998.5 申请日期 2011.05.11
申请人 华南理工大学 发明人 郭礼华
分类号 G06F21/00(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F21/00(2006.01)I
代理机构 代理人
主权项 一种商用网页恶意篡改检测方法,其特征在于:包括篡改学习和篡改检测两部分;所述篡改学习的具体步骤为:(1)训练样本集的收集:根据当前商用网页的链接,下载链接中的商用网页图像,组成训练样本的正样本集;,再下载非当前商用网页的图像,组成训练样本的负样本集,正负样本组成训练样本集;(2)训练样本集的特征提取:提取训练样本集的图像颜色直方图特征和灰度梯度直方图特征,将所提取的两个特征进行级联得到样本的总特征矢量;(3)训练样本集的训练:将总特征矢量送入支持向量机分类器进行训练,得到已训练的支持向量机分类器,即得到了支持向量机分类器最佳分类面;所述篡改检测的具体步骤为:按照篡改学习的步骤(1)和(2)所述的方法,从当前商用网页下载图像,并提取图像的颜色直方图特征和灰度梯度直方图特征;然后将提取的特征送入已训练的支持向量机分类器中,根据最佳分类面对当前商用网页图像进行属性检测;如果当前图像的属性是正样本,表明当前商用网页没有恶意篡改;如果当前网页图像属性是负样本,表明当前商用网页已进行恶意篡改,给出篡改报警。
地址 510640 广东省广州市天河区五山路381号