发明名称 利用图片的局部不变特征检测图像型垃圾邮件的方法
摘要 利用图片的局部不变特征检测图像型垃圾邮件的方法是一种利用健壮特征的加速提取算法来提取图片中的垃圾信息的不变区域特征,从而生成图片的特征向量,用最大可能性算法估计高斯混合模型的参数,来训练高斯混合模型分类器。经过实验能够提高垃圾邮件的召回率,节省程序运算时间和空间。获得基于高斯混合模型的分类器。对图像型垃圾邮件进行检测的实现方法,整个方法包括图片特征的提取,高斯混合模型参数的估计,图像型邮件的检测三个模块。
申请公布号 CN101819637A 申请公布日期 2010.09.01
申请号 CN201010139946.8 申请日期 2010.04.02
申请人 南京邮电大学 发明人 张卫丰;杨波;周国强;张迎周;陆柳敏;许碧娣;王慕妮;王宗辉;韩蕊;陆柳青
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 叶连生
主权项 一种利用图片的局部不变特征检测图像型垃圾邮件的方法,其特征在于该方法主要分为以下步骤:一、首先根据样本集进行训练步骤1)对待训练的图片数据集进行标签,分为垃圾图片和正常图片;步骤2)采用“健壮特征的加速提取算法”分别提取每个垃圾图片和正常图片的局部不变特征描述符,每个局部不变特征描述符出向量构成;步骤3)利用“均值聚类算法”对训练集中每个垃圾图片和正常图片的局部不变特征描述符进行聚类,最终得到若干个聚类中心;以此聚类中心为参照点,将每个图片的局部不变特征描述符投影到这些参考点上,这样将每个图片标准化为若干维的向量;步骤4)分别把训练集中正常图片和垃圾图片所对应的向量作为高斯混合模型的训练样本,利用最大似然函数估计算法分别估计垃圾图片集合和正常图片集合的高斯混合模型的参数;步骤5)由最大似然函数估计算法得到的垃圾图片集合和正常图片集合对应高斯混合模型的参数,这样可以确定正常图片集合和垃圾图片集合的多元高斯混合模型的分布函数。二、然后进行检测过程:步骤21)对于待检测的图片,利用健壮特征的加速提取算法来提取图片的局部不变特征描述符;步骤22)利用步骤3)中的聚类中心为参考点,对步骤21)中的局部不变特征描述符进行标准化,得到待检测图片的向量;步骤23)以待测试图片的向量代入分布函数,分别计算正常图片高斯混合模型的分布函数值和垃圾图片的高斯混合模型的分布函数值;步骤24)根据步骤23)得到的分布函数值来进行分类:哪个值大则属于对应的图片。
地址 210003 江苏省南京市新模范马路66号
您可能感兴趣的专利