发明名称 |
一种文本分类的方法及文本分类系统 |
摘要 |
本发明实施例公开了一种文本分类的方法及文本分类系统,用于根据训练语料进行分类器训练生成分类模型,在进行预测文本分类之前,对分类模型的准确率进行验证,从而提高了对预测文本的文本分类的准确率。本发明实施例方法包括:建立类别词库及训练语料库,训练语料库中包含训练语料,训练语料的文本类别已知;根据训练语料库中的训练语料进行分类器训练,生成分类模型;验证分类模型的准确率是否达到预置条件;若是,则获取预测文本,根据分类模型得到预测文本的文本类别。 |
申请公布号 |
CN106021461A |
申请公布日期 |
2016.10.12 |
申请号 |
CN201610327131.X |
申请日期 |
2016.05.17 |
申请人 |
深圳市中润四方信息技术有限公司 |
发明人 |
李奕锦;刘祥涛;赵彦晖;孙淏添 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市深佳知识产权代理事务所(普通合伙) 44285 |
代理人 |
王仲凯 |
主权项 |
一种文本分类的方法,其特征在于,包括:建立类别词库及训练语料库,所述训练语料库中包含训练语料,所述训练语料的文本类别已知;根据所述训练语料库中的所述训练语料进行分类器训练,生成分类模型;验证所述分类模型的准确率是否达到预置条件;若是,则获取预测文本,根据所述分类模型得到所述预测文本的文本类别。 |
地址 |
518000 广东省深圳市南山区高新中二道深圳软件园8栋601-B1 |