发明名称 一种文本的情感分类方法及装置
摘要 本发明公开了一种文本的情感分类方法及装置,所述方法经过对相关领域情感语料的分析处理,构建了一个多类分类器,再利用多类分类器将待分类文本分为多种评价对象类别的句子,利用不同评价对象的句子集合分别构建一个基情感分类器,以判断评价对象类别句子的情感倾向,最后融合不同评价对象类别中表示相同情感等级的后验概率,选取后验概率融合结果大的情感等级为所述待分类文本的情感类别。通过本发明实施例公开的文本的情感分类方法及装置,将评价对象归为固定的几个类别,分别分析每一个评价对象类别的句子的情感倾向,再将不同评价对象类别的情感倾向融合,根据融合结果判断待分类文本的情感类别;这种方法大大提高了文本情感分类的准确率。
申请公布号 CN102682124B 申请公布日期 2014.07.09
申请号 CN201210151571.6 申请日期 2012.05.16
申请人 苏州大学 发明人 李寿山;张慧;周国栋
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 常亮
主权项 一种文本的情感分类方法,其特征在于,包括:预处理过程:选取待分类文本对应领域的情感语料;对所述情感语料进行分析处理,获取标注有不同评价对象类别的句子;以所述标注有不同评价对象类别的句子为训练集构建多类分类器;分类过程:利用所述多类分类器将待分类文本分为标注有不同评价对象类别的句子;从获得的标注有不同评价对象类别的句子中,确定包含标注有同一评价对象类别的句子的集合;分别以所述包含标注有同一评价对象类别的句子的集合为训练集,构建与其对应的基情感分类器;采用所述基情感分类器对与其对应的评价对象类别的情感等级进行划分,得到多个情感等级,并分别得到与所述多个情感等级对应的后验概率;根据乘法融合规则融合每一个基情感分类器的分类结果中同一情感等级的后验概率;选取后验概率融合结果大的情感等级为所述待分类文本的情感类别;所述评价对象类别包括整体、硬件和软件;其中,所述对所述情感语料进行分析处理,获取标注有不同评价对象类别的句子,包括:采用分句、分词和词性标注工具对所述情感语料进行分句、分词和词性标注;根据分词和词性标注的结果和预设的评价对象对应关系表为每一个句子标注评价对象类别,所述评价对象对应关系表中记录了所述待分类文本对应领域的所有评价对象与评价对象类别中整体、硬件或软件的对应关系;所述利用所述多类分类器将待分类文本分为带有不同评价对象类别的句子,包括:利用分句、分词和词性标注工具将待分类文本分句、分词及词性标注;将分好的句子中后验概率大的评价对象类型标注在所述句子中。
地址 215123 江苏省苏州市工业园区仁爱路199号
您可能感兴趣的专利