发明名称 | 一种短信文本的分类方法和系统 | ||
摘要 | 本发明公开了一种短信文本的分类方法和系统包括:计算分布式文件系统HDFS上所有短信样本的特征向量;判断出HDFS上的短信样本未分类,根据计算得到的特征向量对所述短信样本进行分类;保存短信样本的类别和计算得到的特征向量,形成HDFS上的第一类库;将第一类库转换为流式计算系统支持的第二类库;流式计算系统根据第二类库对待分类短信进行分类。本发明能够对短信文本进行实时分类。 | ||
申请公布号 | CN104123393A | 申请公布日期 | 2014.10.29 |
申请号 | CN201410394927.8 | 申请日期 | 2014.08.12 |
申请人 | 中国联合网络通信集团有限公司 | 发明人 | 李浩;罗云彬;王志军;王伟华 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京安信方达知识产权代理有限公司 11262 | 代理人 | 白莹;栗若木 |
主权项 | 一种短信文本的分类方法,其特征在于,包括:计算分布式文件系统HDFS上所有短信样本的特征向量;判断出HDFS上的短信样本未分类,根据计算得到的特征向量对所述短信样本进行分类;保存短信样本的类别和计算得到的特征向量,形成HDFS上的第一类库;将第一类库转换为流式计算系统支持的第二类库;流式计算系统根据第二类库对待分类短信进行分类。 | ||
地址 | 100033 北京市西城区金融大街21号 |