发明名称 |
一种基于投票的跨语言主客观情感分类方法 |
摘要 |
本发明公开了一种基于投票的跨语言主客观情感分类方法,包括如下步骤:S1,根据源语言的情感词典构建目标语言的情感词典;S2,采用规则算法、机器翻译与统计机器学相结合的算法、极性特征值计算算法三种算法分别从待标注文本中的句子中提取词,根据构建的目标语言的情感词典,判断词的情感极性,进而进行句子的主客观性质判断;S3,获得根据三种算法得到的句子的主客观性质的判断结果,通过投票对句子的主客观性质进行判定。该方法可以在一定准确度的前提下,充分考虑目标语言的语境和使用惯,有效地解决了目标语言的标注语料稀缺的问题,在保证召回率的前提下进一步提高分类准确率。 |
申请公布号 |
CN105320960A |
申请公布日期 |
2016.02.10 |
申请号 |
CN201510662283.0 |
申请日期 |
2015.10.14 |
申请人 |
北京航空航天大学 |
发明人 |
王德庆;张辉;陈勇;刘瑞;何晓楠 |
分类号 |
G06K9/62(2006.01)I;G06F17/28(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
北京汲智翼成知识产权代理事务所(普通合伙) 11381 |
代理人 |
陈曦;贾兴昌 |
主权项 |
一种基于投票的跨语言主客观情感分类方法,其特征在于包括如下步骤:S1,根据源语言的情感词典构建目标语言的情感词典;S2,采用规则算法、机器翻译与统计机器学习相结合的算法、极性特征值计算算法三种算法分别从待标注文本中的句子中提取词,根据构建的目标语言的情感词典,判断所述词的情感极性,进而进行句子的主客观性质判断;S3,获得根据三种算法得到的句子的主客观性质的判断结果,通过投票对句子的主客观性质进行判定。 |
地址 |
100191 北京市海淀区学院路37号 |