发明名称 文本细粒度情感分析方法及装置
摘要 本发明公开了一种文本细粒度情感分析方法,包括如下步骤:情感词极性强度量化计算;评价对象属性及其情感表达元素的联合识别;细粒度属性分类及其情感计算。本发明还公开了一种文本细粒度情感分析装置,包括评论数据采集及预处理模块、数据处理模块、数据分析模块、信息展示模块。本发明的细粒度情感分析方法采用的三大步骤有如下优点:(1)情感词极性强度量化计算步骤,在正确率上提高了将近30%;(2)评价对象属性及其情感表达元素的联合识别,针对特定情感分析应用领域,其联合识别正确率达到了80%以上;(3)细粒度属性分类及其情感计算利用细粒度属性分类,可以提升情感计算整体性能2.5%以上。
申请公布号 CN103049435B 申请公布日期 2015.10.14
申请号 CN201310000734.5 申请日期 2013.01.04
申请人 浙江工商大学 发明人 施寒潇;厉小军
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 杭州浙科专利事务所(普通合伙) 33213 代理人 吴秉中
主权项 一种文本细粒度情感分析方法,包括如下步骤:情感词极性强度量化计算;评价对象属性及其情感表达元素的联合识别;细粒度属性分类及其情感计算;所述情感词极性强度量化计算包括基础情感词的极性强度量化计算和复合情感词的极性强度量化计算;所述复合情感词的极性强度量化计算分为:基础情感词的叠词;基础情感词<b>+</b>基础情感词;否定词<b>+</b>基础情感词;程度修饰词+基础情感词;否定词+程度修饰词+基础情感词或程度修饰词+否定词+基础情感词,采用如下公式计算:<img file="236782dest_path_image001.GIF" wi="506" he="57" />(5)其中<img file="153923dest_path_image002.GIF" wi="25" he="25" />为基础词的情感值,<img file="636724dest_path_image003.GIF" wi="30" he="25" />为程度词的作用系数,其范围为0.5、0.7、0.9、1.1、1.3、1.5,<img file="31933dest_path_image004.GIF" wi="17" he="23" />为程度词反作用系数,也就是作用系数<img file="783988dest_path_image003.GIF" wi="30" he="25" />的范围极值之和,所以<img file="793402dest_path_image004.GIF" wi="17" he="23" />取值为2,<img file="60435dest_path_image005.GIF" wi="69" he="28" />为词<img file="197018dest_path_image002.GIF" wi="25" he="25" />情感值的符号值,如果该词的情感值大于0,则为+1,如果小于0,则为‑1;<b><img file="865897dest_path_image006.GIF" wi="66" he="28" /></b>为词<img file="547676dest_path_image002.GIF" wi="25" he="25" />情感值的绝对值。
地址 310018 浙江省杭州市下沙高教园区学正街18号