发明名称 基于统计特征的网页恶意脚本检测方法
摘要 本发明专利属于计算机安全领域,主要利用恶意脚本中的统计特征快速、准确地检测网页中是否含有恶意脚本。本发明的基本原理是利用恶意网页代码必定经过处理,而处理后的网页中的正常字符和非正常字符的比例有着明显的差异,所以利用网页的字符统计特征(包括字符频率统计、相邻字符跨度值统计、与字典匹配度统计)来检测恶意脚本。本发明用于检测网页中的恶意脚本,从而实现对网络中的有害网页进行快速检测,并预先阻拦恶意脚本的运行,为上网用户提供安全的网络环境。
申请公布号 CN100478953C 申请公布日期 2009.04.15
申请号 CN200610152531.8 申请日期 2006.09.28
申请人 北京理工大学 发明人 陶然;李志勇;张昊;王越;杜华
分类号 G06F17/30(2006.01)I;G06F21/00(2006.01)I;H04L29/06(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京理工大学专利中心 代理人 张利萍
主权项 1.一种网页恶意脚本检测方法,主要利用恶意脚本中的统计特征快速、准确地检测网页中是否含有恶意脚本,从而实现对网络中的有害网页进行快速检测,并预先阻拦恶意脚本的运行,为上网用户提供安全的网络环境,其处理的具体步骤是:a.清除网页中的干扰语句以便于统计,b.统计网页中的非正常字符的出现概率,c.对相邻字符间的跨度进行统计,d.创建脚本字典并统计网页与脚本字典的匹配结果,e.为统计网页中的非正常字符出现的概率,对相邻字符间的跨度进行统计,创建脚本字典并统计网页与脚本字典的匹配结果这三种方法分别设置单个方法的权重,将统计网页中的非正常字符的权重设为3,统计相邻字符间跨度的权重设为5,匹配脚本字典的权重设为2,f.设定置信度5为判断网页为正常网页或恶意网页的临界值,若统计非正常字符的结果判断网页可能为恶意网页,则置信度为3,统计相邻字符间跨度判断网页可能为恶意网页的置信度为5,匹配脚本字典判断网页可能为恶意网页的置信度为2,总置信度为三个置信度之和,只有当这三个置信度之和等于或超出5时,即总置信度超出或等于5时,就可以确定该网页为恶意网页。
地址 100081北京市海淀区中关村南大街5号