发明名称 | 一种基于情感值的网络文本情感分析方法 | ||
摘要 | 本发明涉及一种基于情感值的网络文本情感分析方法。本方法的操作步骤如下:第一,对文本进行预处理,段落拆分,标点替换等。第二,句式分析,判断分段文本中疑问句式和感叹句式,对情感值进行加权处理。第三,情感值匹配,根据预定义好情感值的情感词典对文本的每一个分段进行情感词匹配,将情感值带入。第四,对匹配到的情感词进行情感赋值,得到分段情感值。第五,情感值计算,将各个分段情感值相结合计算,得到整句情感值。第六,情感值修正,对每一分段进行情感值处理完毕后,将所有情感值按照一定规则进行修正。第七,情感倾向分析,得出情感值后根据情感值进行情感极性分析。该分析方法能比较准确的分析出中文文本的情感信息。 | ||
申请公布号 | CN104008091A | 申请公布日期 | 2014.08.27 |
申请号 | CN201410224628.X | 申请日期 | 2014.05.26 |
申请人 | 上海大学 | 发明人 | 武星;卓少剑 |
分类号 | G06F17/27(2006.01)I | 主分类号 | G06F17/27(2006.01)I |
代理机构 | 上海上大专利事务所(普通合伙) 31205 | 代理人 | 何文欣 |
主权项 | 一种基于情感值的网络文本情感分析方法,其特征在于分析步骤如下:(1) 文本预处理:主要是对标点符号进行处理以及句子分段;(2) 句式分析:判断分段文本中疑问句式和感叹句式,对情感值进行加权处理;(3) 情感词匹配:对各个分段逐个进行分析,匹配情感值词典,将未匹配到的单词当作中性词语处理;(4) 情感词赋值:对匹配到的情感词进行情感赋值,并进行连接,得到分段情感值;(5) 情感值计算:将各个分段情感值相结合计算,得到整句情感值;(6) 情感值修正:对整个文本根据文本长度进行情感值修正;(7) 情感倾向判断:根据情感值区间对情感倾向进行判断,包括正面、中性和负面。 | ||
地址 | 200444 上海市宝山区上大路99号 |