发明名称 |
一种基于微博文本的情绪分类方法及系统 |
摘要 |
本发明提供一种基于微博文本的情绪分类方法及系统,所述方法包括以下步骤。收集一定数量微博用户发表的微博文本,并将收集到的微博文本进行情绪类型标注。利用分词软件将标注好的微博文本进行分词处理,并将经过分词处理的微博文本作为训练样本,并利用所述训练样本及贝叶斯工具包构建贝叶斯分类器。利用所述贝叶斯分类器,对用户微博文本进行分类,得到分类结果,并根据所述分类结果确定情绪类型。如此,以较高的准确率达到了对微博文本进行情绪分类。 |
申请公布号 |
CN105243095A |
申请公布日期 |
2016.01.13 |
申请号 |
CN201510577717.7 |
申请日期 |
2015.09.11 |
申请人 |
苏州大学张家港工业技术研究院 |
发明人 |
李寿山;黄磊;周国栋 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
唐灵;常亮 |
主权项 |
一种基于微博文本的情绪分类方法,其特征在于,包括以下步骤:S1、收集一定数量微博用户发表的微博文本,并将收集到的微博文本进行情绪类型标注;S2、利用分词软件将标注好的微博文本进行分词处理,并将经过分词处理的微博文本作为训练样本,并利用所述训练样本及贝叶斯工具包构建贝叶斯分类器;S3、利用所述贝叶斯分类器,对用户微博文本进行分类,得到分类结果,并根据所述分类结果确定情绪类型。 |
地址 |
215600 江苏省苏州市张家港市长泾路10号 |