发明名称 |
一种情感分类方法、装置及系统 |
摘要 |
本申请实施例提供一种情感分类方法、装置及系统,通过对待测样本(其中,待测样本为网络平台信息中的位于第一预设时间之后的评论文本)进行分词处理,得到多个词特征;并使用预先设置的最大熵情感分类器,分别计算每个词特征的第一预测子概率和第二预测子概率;进而利用每个特征词第一预测子概率和第二预测子概率确定待测样本的情感类别的方式,实现了对网络平台信息中的评论文本的情感分类,可便于用户对网络平台信息的选取。 |
申请公布号 |
CN106202181A |
申请公布日期 |
2016.12.07 |
申请号 |
CN201610480926.4 |
申请日期 |
2016.06.27 |
申请人 |
苏州大学 |
发明人 |
李寿山;张栋;周国栋;贡正仙 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
常亮 |
主权项 |
一种情感分类方法,其特征在于,包括:对待测样本进行分词处理,得到多个词特征;其中,所述待测样本为网络平台信息中的位于第一预设时间之后的评论文本;使用预先设置的最大熵情感分类器,分别计算每个所述词特征的第一预测子概率和第二预测子概率;其中,所述第一预测子概率指示所述词特征为正面评论,所述第二预测子概率指示所述词特征为负面评论;所述最大熵情感分类器为使用所述网络平台信息中的位于第二预设时间之前的正评论文本和负评论文本作为训练样本集,利用最大熵分类算法进行训练得到的;所述第二预设时间早于所述第一预设时间;将所有所述词特征的第一预测子概率进行乘积运算,得到第一预测概率;将所有所述词特征的第二预测子概率进行乘积运算,得到第二预测概率;比较所述第一预测概率和第二预测概率;根据比较结果,确定所述待测样本的情感类别;其中,当所述第一预测概率大于所述第二预测概率时,确定所述待测样本为正评论文本;当所述第一预测概率小于所述第二预测概率时,确定所述待预测样本为负评论文本。 |
地址 |
215123 江苏省苏州市工业园区仁爱路199号 |