发明名称 一种文本情感指数计算方法和系统
摘要 一种文本情感指数计算方法和系统,方法包括有:步骤A、构建非领域限定的情感词库,选择多个非领域限定的情感词,并将所述非领域限定的情感词及其对应的情感分数保存在非领域限定的情感词库中;步骤B、根据标点符号将待计算文本划分为多个子句,并对每个子句进行分词,然后依次寻找每个子句中包含的非领域限定的情感词,使用情感指数计算规则对子句中所包含的每个非领域限定的情感词的情感分数进行调整,最后根据调整后的非领域限定的情感词的情感分数,统计每个子句的情感分数,从而计算待计算文本的情感指数值。本发明属于自然语言处理技术及模式识别领域,能有效提高文本情感分析的准确率和用户满意度。
申请公布号 CN102929861B 申请公布日期 2015.07.22
申请号 CN201210404224.X 申请日期 2012.10.22
申请人 杭州东信北邮信息技术有限公司 发明人 廖建新;范文;张雷;赵贝尔
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 代理人
主权项 一种文本情感指数计算方法,其特征在于,所述方法包括有:步骤A、构建非领域限定的情感词库,选择多个非领域限定的情感词,并将所述非领域限定的情感词及其对应的情感分数保存在非领域限定的情感词库中;步骤B、根据标点符号将待计算文本划分为多个子句,并对每个子句进行分词,然后依次寻找每个子句中包含的非领域限定的情感词,使用情感指数计算规则对子句中所包含的每个非领域限定的情感词的情感分数进行调整,最后根据调整后的非领域限定的情感词的情感分数,统计每个子句的情感分数,从而计算待计算文本的情感指数值,所述步骤B中,依次寻找每个子句中包含的非领域限定的情感词,使用情感指数计算规则对子句中所包含的每个非领域限定的情感词的情感分数进行调整,进一步包括有:步骤B1、判断每个子句的分词中是否有非领域限定的情感词,如果是,则从非领域限定的情感词库中提取所述非领域限定的情感词对应的情感分数F,继续下一步;如果否,则本流程结束;步骤B2、判断所述子句中位于非领域限定的情感词之前的分词是否存在有转折词,如果是,则将所述非领域限定的情感词的情感分数F调整为2*F,继续下一步;如果否,则继续下一步;所述转折词包括但不仅限于:可是、但是、然而、偏偏、只是、不过、至于、以至、不料、岂知;步骤B3、判断所述子句中非领域限定的情感词之前的分词是否存在有否定词、且否定词与非领域限定的情感词的文字距离小于或等于2,如果是,则将所述非领域限定的情感词的情感分数F调整为‑F,继续下一步;如果否,则继续下一步;所述否定词包括但不仅限于:不、没;步骤B4、判断所述子句中是否存在有副词、且副词与非领域限定的情感词的文字距离小于或等于2,如果是,则将所述非领域限定的情感词的情感分数F调整为2*F,继续下一步;如果否,则继续下一步;所述副词包括但不仅限于:非常、特别;步骤B5、判断非领域限定的情感词是否处于子句的句末,如果是,则将所述非领域限定的情感词的情感分数F调整为2*F。
地址 100191 北京市海淀区知春路9号坤讯大厦7层