发明名称 |
一种垃圾短信检测方法及装置 |
摘要 |
本发明公开了一种垃圾短信检测方法和装置,该方法包括:针对一个待检测短信,将所述待检测短信中包含的信息转换为包含至少一个特征词的特征词集合;将所述特征词集合中包含的每个特征词分别在预设的倒排索引文件中进行查询,确定所述特征词集合与倒排索引文件中包含的垃圾短信信息样本能够匹配的样本数量和匹配权重,根据确定出的样本数量和匹配权重,确定所述待检测短信是否是垃圾短信。能够较好地提高识别垃圾短息的准确性、提升垃圾短信检测的效率、实时性较好。 |
申请公布号 |
CN103813279A |
申请公布日期 |
2014.05.21 |
申请号 |
CN201210457592.0 |
申请日期 |
2012.11.14 |
申请人 |
中国移动通信集团设计院有限公司 |
发明人 |
丁志刚;肖子玉 |
分类号 |
H04W4/14(2009.01)I;H04W12/12(2009.01)I;G06F17/30(2006.01)I |
主分类号 |
H04W4/14(2009.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
郭润湘 |
主权项 |
一种垃圾短信检测方法,其特征在于,包括:针对一个待检测短信,将所述待检测短信中包含的信息转换为包含至少一个特征词的特征词集合;将所述特征词集合中包含的每个特征词分别在预设的倒排索引文件中进行查询,确定所述特征词集合与倒排索引文件中包含的垃圾短信信息样本能够匹配的样本数量和匹配权重,其中所述倒排索引文件中包含特征词、垃圾短信信息样本和匹配权重三者之间的对应关系,所述特征词是表征垃圾短信信息,所述垃圾短信信息样本是包含所述特征词的垃圾短信,所述匹配权重是特征词和垃圾短信信息样本的匹配程度;根据确定出的样本数量和匹配权重,确定所述待检测短信是否是垃圾短信。 |
地址 |
100080 北京市海淀区丹棱街甲16号 |