发明名称 |
一种基于网络的垃圾信息过滤方法和装置 |
摘要 |
本发明公开了一种基于网络过滤垃圾信息的方法,包括以下步骤:对目标信息进行分词取得该信息中的特征元素;根据预置的关键字库取得与所述目标信息特征元素相应的概率值,所述关键字库定期更新;对所述目标信息特征元素的概率值进行累加,将累加的结果与预定的阀值进行比较,若大于所述预定阀值,则认为该目标信息为垃圾信息。这样,使用预置的关键字库验证目标信息,由于避免了现有技术在验证信息的同时需要进行大量复杂的计算系统资源损耗和时间延迟,因此满足了实时过滤垃圾信息的要求。 |
申请公布号 |
CN101155182A |
申请公布日期 |
2008.04.02 |
申请号 |
CN200610140726.0 |
申请日期 |
2006.09.30 |
申请人 |
阿里巴巴公司 |
发明人 |
董启江;孙永明 |
分类号 |
H04L29/06(2006.01);H04L12/58(2006.01) |
主分类号 |
H04L29/06(2006.01) |
代理机构 |
北京集佳知识产权代理有限公司 |
代理人 |
逯长明 |
主权项 |
1.一种基于网络的垃圾信息过滤方法,其特征在于,包括以下步骤:对目标信息进行分词取得该信息中的特征元素;根据预置的关键字库取得与所述目标信息特征元素相应的概率值,所述关键字库定期更新;对所述目标信息特征元素的概率值进行累加,将累加的结果与预定的阀值进行比较,若大于所述预定阀值,则认为该目标信息为垃圾信息。 |
地址 |
开曼群岛大开曼乔治敦 |