发明名称 一种文本分类的方法及文本分类系统
摘要 本发明实施例公开了一种文本分类的方法及文本分类系统,用于根据训练语料进行分类器训练生成分类模型,在进行预测文本分类之前,对分类模型的准确率进行验证,从而提高了对预测文本的文本分类的准确率。本发明实施例方法包括:建立类别词库及训练语料库,训练语料库中包含训练语料,训练语料的文本类别已知;根据训练语料库中的训练语料进行分类器训练,生成分类模型;验证分类模型的准确率是否达到预置条件;若是,则获取预测文本,根据分类模型得到预测文本的文本类别。
申请公布号 CN106021461A 申请公布日期 2016.10.12
申请号 CN201610327131.X 申请日期 2016.05.17
申请人 深圳市中润四方信息技术有限公司 发明人 李奕锦;刘祥涛;赵彦晖;孙淏添
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人 王仲凯
主权项 一种文本分类的方法,其特征在于,包括:建立类别词库及训练语料库,所述训练语料库中包含训练语料,所述训练语料的文本类别已知;根据所述训练语料库中的所述训练语料进行分类器训练,生成分类模型;验证所述分类模型的准确率是否达到预置条件;若是,则获取预测文本,根据所述分类模型得到所述预测文本的文本类别。
地址 518000 广东省深圳市南山区高新中二道深圳软件园8栋601-B1