发明名称 |
一种融合显性和隐性特征的中文微博情感分析方法 |
摘要 |
一种融合显性和隐性特征的中文微博情感分析方法,包括以下步骤:1)微博显性特征处理,1.1)表情符号处理;1.2)情感词处理;2)微博隐性特征处理:基于频繁项集创建初始情感簇,每个初始情感簇文本都含有频繁项集,采用知网的中文语义相似度模型,根据最大语义隶属度原则分离各个初始情感簇;最后,通过定义簇间语义相似度矩阵,完成微博情感簇的凝聚式层次聚类,并优化得到最终的情感簇,实现微博情感分析。本发明提供一种灵活性较高、可靠性较好的融合显性和隐性特征的中文微博情感分析方法。 |
申请公布号 |
CN104516947A |
申请公布日期 |
2015.04.15 |
申请号 |
CN201410723617.6 |
申请日期 |
2014.12.03 |
申请人 |
浙江工业大学 |
发明人 |
陈铁明;缪茹一 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
杭州斯可睿专利事务所有限公司 33241 |
代理人 |
王利强 |
主权项 |
一种融合显性和隐性特征的中文微博情感分析方法,其特征在于:所述中文微博情感分析方法包括以下步骤:1)微博显性特征处理,具体包括以下过程:1.1)表情符号处理:根据微博自带的表情构建情感符号库,依据7类情感分类方法,将情感分为高兴、喜好、愤怒、悲伤、恐惧、厌恶、惊讶七个类别,将出现频率排在前150的表情符号,作统一化处理,即先建立情感符号表,将150个表情符号放入情感符号表,通过查表方式判断该情感符号是否属于情感符号表,若是则提取情感符号,通过转换成情感类别后写入情感特征表;1.2)情感词处理:建立一个情感词典的情感词表,将这些情感词放入词表中,通过查表的方式判断通过文本分词后是否是情感词,若是则提取情感词,并写入情感特征表;先建立一个网络词汇的情感词表,将这些网络词汇放入词表中,通过查表方式判定部分微博内容的情感类别;2)微博隐性特征处理:基于频繁项集创建初始情感簇,每个初始情感簇文本都含有频繁项集,采用知网的中文语义相似度模型,根据最大语义隶属度原则分离各个初始情感簇;最后,通过定义簇间语义相似度矩阵,完成微博情感簇的凝聚式层次聚类,并优化得到最终的情感簇,实现微博情感分析。 |
地址 |
310014 浙江省杭州市下城区朝晖六区潮王路18号浙江工业大学 |