发明名称 一种融合显性和隐性特征的中文微博情感分析方法
摘要 一种融合显性和隐性特征的中文微博情感分析方法,包括以下步骤:1)微博显性特征处理,1.1)表情符号处理;1.2)情感词处理;2)微博隐性特征处理:基于频繁项集创建初始情感簇,每个初始情感簇文本都含有频繁项集,采用知网的中文语义相似度模型,根据最大语义隶属度原则分离各个初始情感簇;最后,通过定义簇间语义相似度矩阵,完成微博情感簇的凝聚式层次聚类,并优化得到最终的情感簇,实现微博情感分析。本发明提供一种灵活性较高、可靠性较好的融合显性和隐性特征的中文微博情感分析方法。
申请公布号 CN104516947A 申请公布日期 2015.04.15
申请号 CN201410723617.6 申请日期 2014.12.03
申请人 浙江工业大学 发明人 陈铁明;缪茹一
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州斯可睿专利事务所有限公司 33241 代理人 王利强
主权项 一种融合显性和隐性特征的中文微博情感分析方法,其特征在于:所述中文微博情感分析方法包括以下步骤:1)微博显性特征处理,具体包括以下过程:1.1)表情符号处理:根据微博自带的表情构建情感符号库,依据7类情感分类方法,将情感分为高兴、喜好、愤怒、悲伤、恐惧、厌恶、惊讶七个类别,将出现频率排在前150的表情符号,作统一化处理,即先建立情感符号表,将150个表情符号放入情感符号表,通过查表方式判断该情感符号是否属于情感符号表,若是则提取情感符号,通过转换成情感类别后写入情感特征表;1.2)情感词处理:建立一个情感词典的情感词表,将这些情感词放入词表中,通过查表的方式判断通过文本分词后是否是情感词,若是则提取情感词,并写入情感特征表;先建立一个网络词汇的情感词表,将这些网络词汇放入词表中,通过查表方式判定部分微博内容的情感类别;2)微博隐性特征处理:基于频繁项集创建初始情感簇,每个初始情感簇文本都含有频繁项集,采用知网的中文语义相似度模型,根据最大语义隶属度原则分离各个初始情感簇;最后,通过定义簇间语义相似度矩阵,完成微博情感簇的凝聚式层次聚类,并优化得到最终的情感簇,实现微博情感分析。
地址 310014 浙江省杭州市下城区朝晖六区潮王路18号浙江工业大学