发明名称 一种基于微博文本的情绪分类方法及系统
摘要 本发明提供一种基于微博文本的情绪分类方法及系统,所述方法包括以下步骤。收集一定数量微博用户发表的微博文本,并将收集到的微博文本进行情绪类型标注。利用分词软件将标注好的微博文本进行分词处理,并将经过分词处理的微博文本作为训练样本,并利用所述训练样本及贝叶斯工具包构建贝叶斯分类器。利用所述贝叶斯分类器,对用户微博文本进行分类,得到分类结果,并根据所述分类结果确定情绪类型。如此,以较高的准确率达到了对微博文本进行情绪分类。
申请公布号 CN105243095A 申请公布日期 2016.01.13
申请号 CN201510577717.7 申请日期 2015.09.11
申请人 苏州大学张家港工业技术研究院 发明人 李寿山;黄磊;周国栋
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 唐灵;常亮
主权项 一种基于微博文本的情绪分类方法,其特征在于,包括以下步骤:S1、收集一定数量微博用户发表的微博文本,并将收集到的微博文本进行情绪类型标注;S2、利用分词软件将标注好的微博文本进行分词处理,并将经过分词处理的微博文本作为训练样本,并利用所述训练样本及贝叶斯工具包构建贝叶斯分类器;S3、利用所述贝叶斯分类器,对用户微博文本进行分类,得到分类结果,并根据所述分类结果确定情绪类型。
地址 215600 江苏省苏州市张家港市长泾路10号