发明名称 文本分类方法和装置
摘要 本发明公开了一种文本分类方法,所述方法包括:获取待分类文本,对所述待分类文本进行预处理操作,得到预处理后的待分类文本;获取所述预处理后的待分类文本中的关键词,以生成关键词集合;根据预设算法计算所述关键词集合中的各个关键词对应的权重值,根据所述权重值确定所述待分类文本所属类别。本发明还公开了一种文本分类装置。本发明实现了在对比文本分类过程中,不需要采用训练语料进行分类器训练,提高了文本分类的效率。
申请公布号 CN105956031A 申请公布日期 2016.09.21
申请号 CN201610262036.6 申请日期 2016.04.25
申请人 深圳市永兴元科技有限公司 发明人 张锐
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市世纪恒程知识产权代理事务所 44287 代理人 胡海国
主权项 一种文本分类方法,其特征在于,所述文本分类方法包括:获取待分类文本,对所述待分类文本进行预处理操作,得到预处理后的待分类文本;获取所述预处理后的待分类文本中的关键词,以生成关键词集合;根据预设算法计算所述关键词集合中的各个关键词对应的权重值,根据所述权重值确定所述待分类文本所属类别。
地址 518057 广东省深圳市南山区高新技术产业园区深圳软件园6栋401-402