发明名称 一种基于分类器动态更新的垃圾邮件检测方法及系统
摘要 本发明涉及一种基于分类器动态更新的垃圾邮件检测方法及系统,包括步骤:构建由分类向量构成的分类器;获取待检测邮件的特征向量与每个分类向量的相似度;由相似度最高的分类向量作出分类;获取用户反馈的待检测邮件的分类;统计每个分类向量作出正确分类的次数;接收新的待测邮件后按上述步骤分类,当达到设定条件时更新分类器,正确分类次数超过设定值的分类向量被保留,对新接收的待检测邮件作出分类;该系统包括分类器更新单元,在达到设定条件时更新分类器,将正确分类次数超过设定值的分类向量保留并用于参与以后的邮件分类。本发明将分类器中分类效果好的分类向量保留一段时间,保证了分类的准确性,不会受到新数据流的局限性的影响。
申请公布号 CN101316246A 申请公布日期 2008.12.03
申请号 CN200810116913.4 申请日期 2008.07.18
申请人 北京大学 发明人 谭营;阮光尘
分类号 H04L12/58(2006.01);H04L12/26(2006.01) 主分类号 H04L12/58(2006.01)
代理机构 北京路浩知识产权代理有限公司 代理人 王朋飞
主权项 1、一种基于分类器动态更新的垃圾邮件检测方法,其特征在于,包括步骤:s101,构建由分类向量构成的分类器;s102,获取待检测邮件的特征向量与每个分类向量的相似度,由相似度最高的分类向量作出对所述待检测邮件的分类;s103,获取用户反馈的所述待检测邮件的分类,统计每个分类向量作出正确分类的次数;s104,重复步骤s102~s103,在步骤s102中,还由正确分类次数超过设定值的分类向量作出对所述待检测邮件的分类;s105,达到设定条件时更新所述分类器,正确分类次数超过设定值的分类向量被保留;s106,重复步骤s102~s105,在步骤s102中,还由被保留的分类向量作出所述对待检测邮件的分类。
地址 100871北京市海淀区颐和园路5号