发明名称 |
基于集成学的中文评论文本的情感分类方法与系统 |
摘要 |
本发明涉及模式识别领域,公开了一种基于集成学的中文评论文本的情感分类方法和基于该方法的系统。包括:a)从网页中获取中文评论文本,并进行预处理,b)并行地序列训练多分类器系统,c)用基分类器对待分类的评论文本分类,将分类输出转化为直觉模糊数,d)结合基分类器的权重和引导变量,融合待分类的评论文本的情感倾向,并做出分类决策。本发明具有以下优点:训练和分类速度极快;采取序列学策略,便于发现新兴词汇,降低对语料库的要求;通过集成学来提高分类准确率,因而基于该方法的系统能更好地支持管理或购买决策。 |
申请公布号 |
CN102789498A |
申请公布日期 |
2012.11.21 |
申请号 |
CN201210245263.X |
申请日期 |
2012.07.16 |
申请人 |
钱钢 |
发明人 |
钱钢;王海;沈玲玲;乔爱萍 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
南京天翼专利代理有限责任公司 32112 |
代理人 |
汤志武 |
主权项 |
基于集成学习的中文评论文本的情感分类方法,其特征在于,所述方法包括:步骤101:从网页中获取中文评论文本,并进行预处理;步骤102:并行地序列训练多分类器系统;步骤103:用基分类器对待分类的中文评论文本分类,将分类输出转化为直觉模糊数;步骤104:结合基分类器的权重和引导变量,融合待分类的中文评论文本的情感倾向,并做出分类决策。 |
地址 |
210097 江苏省南京市鼓楼区宁海路122号南京师范大学计算机学院 |