发明名称 基于图像处理的钓鱼网页检测方法
摘要 本发明涉及图像信息处理以及网络安全领域,尤其涉及一种基于图像分割的钓鱼网页检测方法。本发明采用逐一计算可疑钓鱼网页与各个受保护网页之间的相似度,将可疑网页与受保护网页之间的相似度小于预先设定的值的可疑网页判为针对该受保护网页的钓鱼网页。本发明的特点是直接分析用户所访问的网页图像,可靠性高,不易被网页设计技巧所欺骗;通过对网页图片进行分割可以进行部分匹配,防止由于部分相似而引起的网络钓鱼;使用子图像特征和关系并重的匹配方法,更加符合视觉心理学,使匹配结果更加准确。根据试验测得的数据显示,本发明具有网页图像检测准确性高的优点。
申请公布号 CN101145902A 申请公布日期 2008.03.19
申请号 CN200710130809.6 申请日期 2007.08.17
申请人 东南大学 发明人 曹玖新;罗军舟;毛波
分类号 H04L9/00(2006.01);G06T7/00(2006.01);G06T5/00(2006.01) 主分类号 H04L9/00(2006.01)
代理机构 南京经纬专利商标代理有限公司 代理人 陆志斌
主权项 1.一种基于图像处理的钓鱼网页检测方法,其特征在于方法具体如下:逐一计算可疑钓鱼网页与各个受保护网页之间的相似度,将可疑网页与受保护网页之间的相似度小于预先设定的值的可疑网页判为针对该受保护网页的钓鱼网页;上述网络钓鱼为:通过仿造网上金融或其他网络服务提供商的相关页面,诱导用户输入敏感信息,并非法取得该敏感信息的手段;上述可疑钓鱼网页为:从可疑邮件中检测出的链接地址所指向的网页,或由用户上报的钓鱼网页;上述受保护网页为:网络钓鱼所伪造的对象网页;上述计算网页相似度的方法为:步骤1,将网页转换为图像;步骤2,对所得图像进行分割;步骤3,提取其分割后子图像的图像特征;步骤4,生成子图像之间的相对位置关系;步骤5,将子图像的图像特征和子图像的相对位置关系组成该页面的特征关系集合;步骤6,计算两个网页的特征关系集合之间的距离并以此作为这两个网页的相似度,两个网页之间的距离小于0.02的两个网页为相似网页;其中步骤4中子图像之间的相对位置关系由一个9维向量表示,该9维向量的每个分量表示由任一子图像所确定的9个象限中的每个象限与另一子图像之间的位置关系,设用于确定9个象限的任一子图像为矩形,延长该矩形的四条边将把图像平面分为9个部分,从左上角开始顺时针编号1~8,中心编号为9,由此形成第1~9象限,该子图像与另一子图像之间相对位置关系的求取方法为:只需判断另一子图像在该子图像所分割的9个部分中的分布状况,将出现全部或部分另一子图像的象限记为1,则与该象限对应的第i维分量就为1,否则为0,根据上述方法,求出由关系矩阵表示的原网页图像所有子图像之间的相对位置关系。
地址 210096江苏省南京市四牌楼2号