发明名称 |
一种文本情感倾向分析系统 |
摘要 |
本发明提出了一种文本情感倾向分析系统,自动分析文本的情感倾向性,效率高,针对性强,人工成本低,其包括:样本训练模块、实体提取模块、特征提取模块、情感倾向识别模块,样本训练模块连接实体提取模块,样本训练模块和实体提取模块分别连接特征提取模块,特征提取模块连接情感倾向识别模块;其中,样本训练模块,用于建立一个实体词典和一个或多个情感倾向词典,每一个情感倾向词典用于收纳同一类别的语料,词典构成判别模板;实体提取模块,参照实体词典,过滤不含实体的内容,提取实体文本,作为需要判别情感倾向的对象。特征提取模块,对照判别模板,根据情感倾向词典对实体文本进行筛选,从而提取实体文本中的特征项。 |
申请公布号 |
CN104182387A |
申请公布日期 |
2014.12.03 |
申请号 |
CN201410347686.1 |
申请日期 |
2014.07.21 |
申请人 |
安徽华贞信息科技有限公司 |
发明人 |
贾岩 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
合肥市长远专利代理事务所(普通合伙) 34119 |
代理人 |
程笃庆;黄乐瑜 |
主权项 |
一种文本情感倾向分析系统,其特征在于,包括:样本训练模块、实体提取模块、特征提取模块、情感倾向识别模块;样本训练模块连接实体提取模块,样本训练模块和实体提取模块分别连接特征提取模块,特征提取模块连接情感倾向识别模块;其中,样本训练模块,用于建立一个实体词典和一个或多个情感倾向词典,每一个情感倾向词典用于收纳同一类别的语料,词典构成判别模板;实体提取模块,参照实体词典,过滤不含实体的内容,提取实体文本,作为需要判别情感倾向的对象;特征提取模块,对照判别模板,根据情感倾向词典对实体文本进行筛选,从而提取实体文本中的特征项;情感倾向识别模块,利用最大熵方法计算出特征项的权值,根据权值大小判别文本的情感倾向性。 |
地址 |
230000 安徽省合肥市高新区黄山路602号国家大学科技园A502 |