发明名称 一种基于联合深度学模型的文本情感分类方法
摘要 一种基于联合深度学模型的文本情感分类方法,本发明涉及文本情感分类方法。本发明为了解决现有SVM等浅层分类方法,会带来维数灾难和数据稀疏等问题。步骤为:一:对文本数据中每一个词进行处理,采用word2vec工具对处理后的文本数据中每一个词进行训练,得到词向量字典;二:得到每个句子的矩阵M,LSTM层将矩阵M进行训练转化为固定维度的向量对输入层进行改进,生成d维h个具有上下文语义关系的词向量;三、采用CNN作为一个可训练的特征检测器从d维h个具有上下文语义关系的词向量中抽取特征;四:将抽取的特征依次连接,输出得到每个类别的概率,概率值最大的类别为所预测的类别。本发明用于自然语言处理领域。
申请公布号 CN106599933A 申请公布日期 2017.04.26
申请号 CN201611223174.X 申请日期 2016.12.26
申请人 哈尔滨工业大学 发明人 徐冰;杨沐昀;杨艳;赵铁军;郑德权;朱聪慧;曹海龙
分类号 G06K9/62(2006.01)I;G06F17/30(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 杨立超
主权项 一种基于联合深度学习模型的文本情感分类方法,其特征在于:所述基于联合深度学习模型的文本情感分类方法包括以下步骤:步骤一:对文本数据中每一个词进行处理,采用word2vec工具对处理后的文本数据中每一个词进行训练,得到词向量字典,其中每一个词都对应着一个词向量;所述word2vec工具为谷歌词向量工具;步骤二:原始输入为词序列(w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>),得到每个句子的矩阵M,M=(x<sub>1</sub>,…,x<sub>s‑1</sub>,x<sub>s</sub>,…,x<sub>max</sub>)∈R<sup>d×max</sup>;LSTM层将矩阵M进行训练转化为固定维度的向量对输入层进行改进,生成d维h个具有上下文语义关系的词向量;其中所述w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>为每个句子中每个词所对应的词标号,x<sub>1</sub>,…,x<sub>s‑1</sub>,x<sub>s</sub>,…,x<sub>max</sub>为与w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>一一对应的词向量,LSTM为长短期记忆模型;步骤三:将步骤二中生成的d维h个具有上下文语义关系的词向量作为CNN的输入,采用CNN作为一个可训练的特征检测器从d维h个具有上下文语义关系的词向量中抽取特征,所述CNN为卷积神经网络;步骤四:将步骤三中抽取的特征依次连接,通过稀疏性激活函数后作为softmax的输入,输出得到每个类别的概率,所有类别的概率的和为1,概率值最大的类别为所预测的类别,这个类别作为联合深度学习模型的结果。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号