发明名称 | 基于关键句的多语言情感数据处理分类方法及系统 | ||
摘要 | 本发明公开了一种基于关键句的多语言情感数据处理分类方法及系统,方法包括:步骤1,从未标注的情感数据集中自动抽取一部情感词典数据包,通过K近邻算法和投票规则来最终判定情感词的极性;步骤2,用抽取出的情感词典数据包计算情感属性的得分,然后再综合考虑位置属性和关键词属性,自动为每一篇文本抽取若干句情感关键句;步骤3,把抽取出的情感关键句直接应用于有监督情感数据分类和无监督情感数据分类中。由此解决多语言翻译时语言迁移和情感数据分析的双重难点问题,以提高情感数据分析的准确性。 | ||
申请公布号 | CN103995853A | 申请公布日期 | 2014.08.20 |
申请号 | CN201410198519.5 | 申请日期 | 2014.05.12 |
申请人 | 中国科学院计算技术研究所 | 发明人 | 程学旗;林政;张瑾;谭松波;徐学可 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京律诚同业知识产权代理有限公司 11006 | 代理人 | 祁建国;梁挥 |
主权项 | 一种基于关键句的多语言情感数据处理分类方法,其特征在于,包括:步骤1,从未标注的情感数据集中自动抽取一部情感词典数据包,通过K近邻算法和投票规则来最终判定情感词的极性;步骤2,用抽取出的情感词典数据包计算情感属性的得分,然后再综合考虑位置属性和关键词属性,自动为每一篇文本抽取若干句情感关键句;步骤3,把抽取出的情感关键句直接应用于有监督情感数据分类和无监督情感数据分类中。 | ||
地址 | 100190 北京市海淀区中关村科学院南路6号 |