发明名称 一种垃圾消息的识别方法、装置和系统
摘要 本申请公开了一种垃圾消息的识别方法、装置和系统,该方法包括:提取通讯消息中的发送方信息;根据所述提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方,如果所述通讯消息的发送方不是所述可预期发送方,则识别所述通讯消息为垃圾消息,或继续对所述通讯消息进行识别。本申请通过判断通讯消息的发送方是否为可预期用户,进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。
申请公布号 CN101534261B 申请公布日期 2012.09.19
申请号 CN200910131229.8 申请日期 2009.04.10
申请人 阿里巴巴集团控股有限公司 发明人 张利明;闻波
分类号 H04L12/58(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L12/58(2006.01)I
代理机构 北京挺立专利事务所(普通合伙) 11265 代理人 叶树明
主权项 一种垃圾消息的识别方法,其特征在于,包括:提取通讯消息中的发送方信息;根据所述提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方,所述判断通讯消息的发送方是否为可预期发送方,包括:设置黑名单列表和/或白名单列表,所述黑名单列表中包括被识别出的垃圾消息的发送方信息,所述白名单列表中包括被识别出的正常消息的发送方信息;如果所述通讯消息的发送方信息记录在所述黑名单列表中,则判断所述通讯消息的发送方不是可预期发送方;和/或如果所述通讯消息的发送方信息记录在所述白名单列表中,则判断所述通讯消息的发送方是可预期发送方;如果所述通讯消息的发送方不是所述可预期发送方,则识别所述通讯消息为垃圾消息,或继续对所述通讯消息进行识别;所述继续对通讯消息进行识别,包括:使用预设的关键词列表,对所述通讯消息的消息内容进行匹配,获取与所述消息内容匹配的关键词的分值;使用预设的正则表达式,对所述通讯消息的消息内容进行匹配,获取与所述消息内容匹配的正则表达式的分值;根据与所述消息内容匹配的关键词和正则表达式的分值,获取所述消息内容的匹配总分值;判断所述消息内容的匹配总分值是否大于或等于预设的阈值;如果所述消息内容的匹配总分值大于或等于所述预设的阈值,则识别所述通讯消息为垃圾消息。
地址 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱
您可能感兴趣的专利