发明名称 一种自适应、安全过滤垃圾邮件的方法
摘要 本发明公开了一种自适应、安全过滤垃圾邮件的方法。它需要两个垃圾邮件判定谱,即规则库和本地规则库。其中,规则库在服务器上自动形成,本地规则库在用户PC机上自动形成。在用户PC机上利用邮件处理系统根据规则库和本地规则库计算所接收的邮件分值,判断接收的邮件是否为垃圾邮件。规则库和本地规则库自动学更新,即在服务器上规则库自动更新,在用户PC机上本地规则库自动更新,用户PC机自动定期获得最新的规则库。对用户所接受的邮件内容经过智能分析,自动将合法邮件保留在收件箱,将垃圾邮件存放隔离区,在提高垃圾邮件识别率的同时降低合法邮件的误判率,从而使用户节省时间和精力。
申请公布号 CN1696943A 申请公布日期 2005.11.16
申请号 CN200410018327.8 申请日期 2004.05.13
申请人 上海极软软件技术有限公司 发明人 肖腾飞;许海林
分类号 G06F17/60 主分类号 G06F17/60
代理机构 上海浦一知识产权代理有限公司 代理人 丁纪铁
主权项 1.一种自适应、安全过滤垃圾邮件的方法,其特征在于:它包括:(1)两个邮件样本库,即中央邮件样本库和本地邮件样本库:中央邮件样本库,包括垃圾邮件和合法邮件的邮件样本集合,存储在服务器上;本地邮件样本库,包括垃圾邮件和合法邮件的邮件样本集合,存储在用户PC机上;(2)两个垃圾邮件的判定谱,存储在用户的PC机上,它包括:中央规则库,即公共垃圾邮件识别特征谱,从中央邮件样本库中形成表征垃圾邮件和合法邮件的字符概率集合;本地规则库,即本地垃圾邮件识别特征谱,从本地邮件样本库中形成表征垃圾邮件和合法邮件的字符概率集合;(3)两个自适应引擎,存储在用户的PC机上,它包括:中央垃圾邮件判定引擎,利用该引擎自动分析邮件,利用中央规则库计算该邮件的分值;本地垃圾邮件判定引擎,利用该引擎自动分析邮件,利用本地规则库计算该邮件的分值;(4)三个阀值:垃圾邮件样本判定阀值,当邮件的分值大于该阀值时,该邮件可作为本地垃圾邮件样本;合法邮件样本判定阀值,当邮件的分值小于该阀值时,该邮件可作为本地合法邮件样本;垃圾邮件判定阀值,当邮件的分值大于该阀值邮件时,该邮件可判定为垃圾邮件,反之则判定为合法邮件; (5)一个邮件处理系统,该系统处理邮件的步骤是:(i)用户接收邮件;(ii)自动装载中央规则库和本地规则库;(iii)利用中央规则库,根据中央垃圾邮件判定引擎计算该邮件的分值;(iv)利用本地规则库,根据本地垃圾邮件判定引擎计算该邮件的分值;(v)综合上述步骤(iii)和(iv)的结果,利用朴素贝叶斯概率公式计算该邮件的分值;当该分值大于或者等于垃圾邮件判定阀值时,则将该邮件归为垃圾邮件,存入邮件隔离区内;当该分值小于垃圾邮件判定阀值时,则将该邮件归为合法邮件,存入收件箱内;当该分值大于垃圾邮件样本判定阀值时,则将该邮件作为垃圾邮件存入本地邮件样本库中,进行自学习形成新的本地规则库;当该分值小于合法邮件样本判定阀值时,则将该邮件作为合法邮件存入本地邮件样本库中,进行自学习形成新的本地规则库;当该分值介于合法邮件样本判定阀值和垃圾邮件样本判定阀值之间时,则该邮件不存入本地邮件样本库;(6)中央规则库定期自动更新,包括中央邮件样本库的自动更新,自动形成新的中央规则库,用户的PC机自动从服务器上下载新的中央规则库;(7)本地规则库自学习,包括本地邮件样本库的自动更新,或者本地邮件样本库的手动更新,自动形成新的本地规则库。
地址 201203上海市浦东新区郭守敬路498号1526室