发明名称 一种短信文本的分类方法和系统
摘要 本发明公开了一种短信文本的分类方法和系统包括:计算分布式文件系统HDFS上所有短信样本的特征向量;判断出HDFS上的短信样本未分类,根据计算得到的特征向量对所述短信样本进行分类;保存短信样本的类别和计算得到的特征向量,形成HDFS上的第一类库;将第一类库转换为流式计算系统支持的第二类库;流式计算系统根据第二类库对待分类短信进行分类。本发明能够对短信文本进行实时分类。
申请公布号 CN104123393A 申请公布日期 2014.10.29
申请号 CN201410394927.8 申请日期 2014.08.12
申请人 中国联合网络通信集团有限公司 发明人 李浩;罗云彬;王志军;王伟华
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京安信方达知识产权代理有限公司 11262 代理人 白莹;栗若木
主权项 一种短信文本的分类方法,其特征在于,包括:计算分布式文件系统HDFS上所有短信样本的特征向量;判断出HDFS上的短信样本未分类,根据计算得到的特征向量对所述短信样本进行分类;保存短信样本的类别和计算得到的特征向量,形成HDFS上的第一类库;将第一类库转换为流式计算系统支持的第二类库;流式计算系统根据第二类库对待分类短信进行分类。
地址 100033 北京市西城区金融大街21号