发明名称 |
文本分类方法、装置及处理器 |
摘要 |
本发明涉及自然语言处理及模式识别技术领域,公开了一种文本分类方法、装置及处理器。该方法中,首先根据分类器获取情感测试样本和情绪测试样本分别属于各个情感类别和各个情绪类别的初始概率,继而选取情感测试样本和情绪测试样本作为共同样本,并获取所述共同样本的联合概率,将所述联合概率和初始概率进行加权求和,并根据求和的结果获取待分类文本所属的情感类别,和/或情绪类别。这个过程中,将待分类文本的情感和情绪进行联合,以实现对文本的情感分类,和/或情绪分类。由于同一文本的情感和情绪之间有着密切的联系,在将待分类文本的情感和情绪联合,以对待分类文本进行分类时,能有效提高文本分类的精度。 |
申请公布号 |
CN103345525A |
申请公布日期 |
2013.10.09 |
申请号 |
CN201310308226.3 |
申请日期 |
2013.07.22 |
申请人 |
苏州大学 |
发明人 |
李寿山;高伟;周国栋 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
常亮 |
主权项 |
一种文本分类方法,其特征在于,包括:获取分类器,所述分类器包括:情感分类器和情绪分类器;获取待分类文本的情感测试样本和情绪测试样本,根据所述分类器,对所述情感测试样本和情绪测试样本进行分类,并获取所述情感测试样本和情绪测试样本分别属于各个情感类别和各个情绪类别的初始概率;选取情感测试样本和情绪测试样本作为共同样本,并获取所述共同样本的联合概率,所述联合概率包括:情感联合概率,和/或情绪联合概率,其中,所述情感联合概率p(si|ej)表示:某个样本的情绪类别为ej的情况下,其情感类别为si的概率,所述情绪联合概率p(ei|sj)表示:某个样本的情感类别为sj的情况下,其情绪类别为ei的概率;对所述初始概率和联合概率进行加权求和,并根据加权求和的结果获取待分类文本所属的情感类别,和/或情绪类别。 |
地址 |
215123 江苏省苏州市工业园区仁爱路199号 |