发明名称 一种基于行为特征的短信分类装置及方法
摘要 本发明提供了一种基于行为特征的短信分类装置及方法,所述装置包括信息采集部件、统计部件、判断部件、执行部件和容错部件,所述信息采集部件采集短信数据信息,所述统计部件提取采集部件提供的信息,并统计每个短信的行为特征信息,所述判断部件获取统计部件的统计结果,并给出判断结果,所述执行部件进行短信分类,所述容错部件提取统计部件中统计失败的数据信息。本发明基于Hadoop平台,利用MapReduce计算模型将短信分类并行化,从而大大提高了大规模短信的分类效率。本发明还可以同时基于多个短信的行为特征进行短信的分类,提高了短信分类的准确性。
申请公布号 CN105721539A 申请公布日期 2016.06.29
申请号 CN201610016942.8 申请日期 2016.01.12
申请人 深圳市深讯数据科技股份有限公司 发明人 程军;王纯甫;李鹏鹏;张大雷;曹毅
分类号 H04L29/08(2006.01)I;G06F17/30(2006.01)I;G06F9/50(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 代理人
主权项 一种基于行为特征的短信分类装置,其特征在于:包括信息采集部件(701)、统计部件(702)、判断部件(703)、执行部件(704)和容错部件(705),所述信息采集部件(701)和统计部件(702)相连,所述统计部件(702)和判断部件(703)相连,所述判断部件(703)和执行部件(704)相连,所述容错部件(705)和统计部件(702)相连;所述信息采集部件(701)采集短信数据信息,所述统计部件(702)提取信息采集部件(701)提供的信息,并统计每个短信的行为特征信息,所述判断部件(703)获取统计部件(702)的统计结果,并给出判断结果,所述执行部件(704)进行短信分类,所述容错部件(705)提取统计部件(702)中统计失败的数据信息。
地址 518000 广东省深圳市南山区高新区南区填海六区芒果网大厦第18层