发明名称 |
基于子句关联的文本情感分类系统和方法 |
摘要 |
本发明提出了一种文本情感极性分类方法和系统。根据本发明的文本情感极性分类方法,首先,根据标点符号和话语标记把文本划分为多个子句;然后,以句子为单位,确定所述句子中所包含的各子句的连接方式;再根据句子中所包含的各子句的连接方式和各子句所包含的情感词的情感强度,计算所述句子中所包含的各子句的情感强度;根据所述文本中的所有子句的情感强度,计算所述文本的情感极性;最后,根据所述文本的情感极性和情感词所属的子句与所属句子中所包含的其他子句的连接方式,更新情感词的情感强度;重复上述步骤,直至文本的情感极性和/或所有情感词的情感强度不再发生改变,此时所计算出的文本的情感极性作为最终确定的文本情感极性。 |
申请公布号 |
CN102033865A |
申请公布日期 |
2011.04.27 |
申请号 |
CN200910175170.2 |
申请日期 |
2009.09.25 |
申请人 |
日电(中国)有限公司 |
发明人 |
赵凯;邱立坤;胡长建 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
中科专利商标代理有限责任公司 11021 |
代理人 |
赵伟 |
主权项 |
一种文本情感极性分类系统,包括:子句划分单元,用于根据标点符号和话语标记把文本划分为多个子句;子句连接方式确定单元,用于以句子为单位,确定所述句子中所包含的各子句的连接方式;子句情感强度计算单元,用于根据句子中所包含的各子句的连接方式和各子句所包含的情感词的情感强度,计算所述句子中所包含的各子句的情感强度;文本情感极性计算单元,用于根据所述文本中的所有子句的情感强度,计算所述文本的情感极性;情感词情感强度更新单元,用于根据所述文本的情感极性和情感词所属的子句与所属句子中所包含的其他子句的连接方式,更新情感词的情感强度;控制器,用于控制上述各个单元的操作,直至文本情感极性计算单元所计算出的文本的情感极性不再改变和/或情感词情感强度更新单元不再更新所有情感词的情感强度,此时输出所计算出的文本的情感极性,作为最终确定的文本情感极性。 |
地址 |
100007 北京市东城区东四十条甲22号南新仓国际大厦B栋12层1222室 |