发明名称 |
文本分类方法和装置 |
摘要 |
本发明公开了一种文本分类方法,所述方法包括:获取待分类文本,对所述待分类文本进行预处理操作,得到预处理后的待分类文本;获取所述预处理后的待分类文本中的关键词,以生成关键词集合;根据预设算法计算所述关键词集合中的各个关键词对应的权重值,根据所述权重值确定所述待分类文本所属类别。本发明还公开了一种文本分类装置。本发明实现了在对比文本分类过程中,不需要采用训练语料进行分类器训练,提高了文本分类的效率。 |
申请公布号 |
CN105956031A |
申请公布日期 |
2016.09.21 |
申请号 |
CN201610262036.6 |
申请日期 |
2016.04.25 |
申请人 |
深圳市永兴元科技有限公司 |
发明人 |
张锐 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市世纪恒程知识产权代理事务所 44287 |
代理人 |
胡海国 |
主权项 |
一种文本分类方法,其特征在于,所述文本分类方法包括:获取待分类文本,对所述待分类文本进行预处理操作,得到预处理后的待分类文本;获取所述预处理后的待分类文本中的关键词,以生成关键词集合;根据预设算法计算所述关键词集合中的各个关键词对应的权重值,根据所述权重值确定所述待分类文本所属类别。 |
地址 |
518057 广东省深圳市南山区高新技术产业园区深圳软件园6栋401-402 |