发明名称 一种垃圾邮件动态检测方法
摘要 本发明涉及一种垃圾邮件动态检测方法,包括步骤:s101,分组依次接收待检测邮件,根据用户对待检测邮件反馈的分类信息,依次构建若干个分类器;s102,利用已构建的分类器对待检测邮件进行分类;s103,获取用户对待检测邮件反馈的分类信息,删除已构建的时间最长的分类器;s104,基于步骤s102中待检测邮件的特征向量及步骤s103中的分类信息,构建新的分类器;s105:重复执行步骤s103~s104。本发明的方法利用不断接收的邮件数据流作为新增加的分类器的训练样本,保证了分类器随着邮件的内容和用户的兴趣不断的发生变化,同时删除构建时间最长的分类器,将陈旧知识及时淘汰,使分类器的性能得到优化。
申请公布号 CN101330476B 申请公布日期 2011.04.13
申请号 CN200810116080.1 申请日期 2008.07.02
申请人 北京大学 发明人 谭营;阮光尘
分类号 H04L12/58(2006.01)I;G06N1/00(2006.01)I 主分类号 H04L12/58(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 戚传江
主权项 一种垃圾邮件动态检测方法,其特征在于,该方法包括步骤:s101:对待检测邮件分组后,依次接收每组待检测邮件,获取待检测邮件的特征向量及用户对待检测邮件反馈的是否为垃圾邮件的分类信息,基于每组待检测邮件的特征向量及分类信息构建分类器,依次得到若干个分类器;同时预先设定好所要构建的分类器的个数;s102:接收待检测邮件,提取所述待检测邮件的特征向量,已构建的分类器根据所述待检测邮件的特征向量依次给出分类结果,所占比例大的分类结果为所述待检测邮件的分类;s103:获取用户对步骤s102中所述待检测邮件反馈的是否为垃圾邮件的分类信息;同时,若当前已构建的分类器的数目已达到s101中所预先设定的个数,则在新一批待测邮件到来时,删除已构建的时间最长的分类器;s104:基于步骤s102中所述待检测邮件的特征向量及步骤s103中获取的分类信息,构建新的分类器;s105:重复执行步骤s102~s104。
地址 100871 北京市海淀区颐和园路5号