发明名称 |
文本信息处理方法及装置 |
摘要 |
本发明提供了一种文本信息处理方法及装置,属于自然语言处理与数据挖掘技术领域。所述方法包括:获取文本信息;对所述文本信息进行分词处理得到多个待定词语;获取所述多个待定词语分别对应的词向量;计算每个待定词语对应的词向量与预设的情感词典中的每个情感词语对应的词向量的相似度;根据每个待定词语对应的词向量与所述情感词典中的每个情感词语对应的词向量的相似度判定所述文本信息的情感属性。相比于现有的方法,本发明提供的文本信息处理方法及装置降低了对情感词典的更新速度的要求,避免了情感词典更新不及时导致情感分析效果较差的问题,有效地提高了分析结果的准确性。 |
申请公布号 |
CN106547740A |
申请公布日期 |
2017.03.29 |
申请号 |
CN201611043882.5 |
申请日期 |
2016.11.24 |
申请人 |
四川无声信息技术有限公司 |
发明人 |
黄勇;卢康;张磊;宋国志;崔凯铜 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京超凡志成知识产权代理事务所(普通合伙) 11371 |
代理人 |
唐维虎 |
主权项 |
一种文本信息处理方法,其特征在于,所述方法包括:获取文本信息;对所述文本信息进行分词处理得到多个待定词语;获取所述多个待定词语分别对应的词向量;计算每个待定词语对应的词向量与预设的情感词典中的每个情感词语对应的词向量的相似度,其中,所述情感词典包括至少两个词库,每个所述词库对应于一种情感属性,每个所述词库包括至少一个情感词语,每个情感词语对应一个词向量;根据每个待定词语对应的词向量与所述情感词典中的每个情感词语对应的词向量的相似度判定所述文本信息的情感属性。 |
地址 |
610041 四川省成都市高新区交子大道365号中海国际中心F座4楼 |