主权项 |
一种文本情感指数计算方法,其特征在于,所述方法包括有:步骤A、构建非领域限定的情感词库,选择多个非领域限定的情感词,并将所述非领域限定的情感词及其对应的情感分数保存在非领域限定的情感词库中;步骤B、根据标点符号将待计算文本划分为多个子句,并对每个子句进行分词,然后依次寻找每个子句中包含的非领域限定的情感词,使用情感指数计算规则对子句中所包含的每个非领域限定的情感词的情感分数进行调整,最后根据调整后的非领域限定的情感词的情感分数,统计每个子句的情感分数,从而计算待计算文本的情感指数值,所述步骤B中,依次寻找每个子句中包含的非领域限定的情感词,使用情感指数计算规则对子句中所包含的每个非领域限定的情感词的情感分数进行调整,进一步包括有:步骤B1、判断每个子句的分词中是否有非领域限定的情感词,如果是,则从非领域限定的情感词库中提取所述非领域限定的情感词对应的情感分数F,继续下一步;如果否,则本流程结束;步骤B2、判断所述子句中位于非领域限定的情感词之前的分词是否存在有转折词,如果是,则将所述非领域限定的情感词的情感分数F调整为2*F,继续下一步;如果否,则继续下一步;所述转折词包括但不仅限于:可是、但是、然而、偏偏、只是、不过、至于、以至、不料、岂知;步骤B3、判断所述子句中非领域限定的情感词之前的分词是否存在有否定词、且否定词与非领域限定的情感词的文字距离小于或等于2,如果是,则将所述非领域限定的情感词的情感分数F调整为‑F,继续下一步;如果否,则继续下一步;所述否定词包括但不仅限于:不、没;步骤B4、判断所述子句中是否存在有副词、且副词与非领域限定的情感词的文字距离小于或等于2,如果是,则将所述非领域限定的情感词的情感分数F调整为2*F,继续下一步;如果否,则继续下一步;所述副词包括但不仅限于:非常、特别;步骤B5、判断非领域限定的情感词是否处于子句的句末,如果是,则将所述非领域限定的情感词的情感分数F调整为2*F。 |