发明名称 用于识别大量号码低频发送垃圾短信情况的方法
摘要 本发明公开了一种用于识别大量号码低频发送垃圾短信情况的方法,该方法为:通过生成短信内容的初步内容特征来排除垃圾短信中的干扰元素,并根据设定的相似度计算规则,计算初步内容特征和现有的内容特征集合中逐个内容特征的相似度,并与设定的相似度最小阈值的比较,生成对应的内容特征并累加计数;在满足统计周期条件时,选取满足发送次数最小阈值的内容特征,并对所有选取的内容特征逐个查找对应的主叫号码集合,根据设定的主叫号码离散规则判断是否将主叫号码集中的各主叫号码加入嫌疑名单。本发明克服了现有短信拦截技术只能识别单一主叫发送垃圾短信的情况,达到治理大量号码发送垃圾短信的目的。
申请公布号 CN103139730B 申请公布日期 2016.03.30
申请号 CN201110375767.9 申请日期 2011.11.23
申请人 上海粱江通信系统股份有限公司 发明人 狄卫华
分类号 H04W4/14(2009.01)I;H04W12/12(2009.01)I 主分类号 H04W4/14(2009.01)I
代理机构 上海兆丰知识产权代理事务所(有限合伙) 31241 代理人 章蔚强
主权项 一种用于识别大量号码低频发送垃圾短信情况的方法,其特征在于,包括下列步骤:步骤S0,设定剔除规则、相似度计算规则、相似度最小阈值、发送次数最小阈值、统计周期以及主叫号码离散规则;步骤S1,读取短信信息,包括主叫号码和短信内容;步骤S2,根据所述剔除规则,排除短信内容中的干扰元素,生成初步内容特征;步骤S3,若现有的内容特征集合为空,将初步内容特征作为其自身的内容特征保存到内容特征集合中,并将该内容特征的发送次数设置为1;若现有的内容特征集合不为空,根据所述的相似度计算规则,计算初步内容特征和现有的内容特征集合中逐个内容特征的相似度,并与所述的相似度最小阈值逐个比较,根据比较结果,生成对应于该初步内容特征的内容特征,并保存到内容特征集合中,同时对该内容特征的发送次数进行累加;步骤S4,判断此刻时间与上一次统计时间的时间差,是否大于或者等于所述的统计周期,若是,则进入步骤S5;若否,则进入步骤S1;步骤S5,提取当前内容特征集合中发送次数大于或者等于所述的发送次数最小阈值的内容特征;步骤S6,对于步骤S5中选取的所有内容特征,按顺序依次选择其中一个内容特征,追溯该内容特征对应的主叫号码集合;步骤S7,判断步骤S6中生成的主叫号码集合中的不同主叫号码个数是否符合设定的主叫号码离散规则,若符合,进入步骤S8;若不符合,进入步骤S9;步骤S8,将步骤S6中生成的主叫号码集合中的主叫号码加入到嫌疑名单;步骤S9,检查步骤S5中选取的所有内容特征是否均处理完毕,若未处理完毕,进入步骤S6。
地址 200070 上海市闸北区天目中路585号1109室