主权项 |
一种基于联合深度学习模型的文本情感分类方法,其特征在于:所述基于联合深度学习模型的文本情感分类方法包括以下步骤:步骤一:对文本数据中每一个词进行处理,采用word2vec工具对处理后的文本数据中每一个词进行训练,得到词向量字典,其中每一个词都对应着一个词向量;所述word2vec工具为谷歌词向量工具;步骤二:原始输入为词序列(w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>),得到每个句子的矩阵M,M=(x<sub>1</sub>,…,x<sub>s‑1</sub>,x<sub>s</sub>,…,x<sub>max</sub>)∈R<sup>d×max</sup>;LSTM层将矩阵M进行训练转化为固定维度的向量对输入层进行改进,生成d维h个具有上下文语义关系的词向量;其中所述w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>为每个句子中每个词所对应的词标号,x<sub>1</sub>,…,x<sub>s‑1</sub>,x<sub>s</sub>,…,x<sub>max</sub>为与w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>一一对应的词向量,LSTM为长短期记忆模型;步骤三:将步骤二中生成的d维h个具有上下文语义关系的词向量作为CNN的输入,采用CNN作为一个可训练的特征检测器从d维h个具有上下文语义关系的词向量中抽取特征,所述CNN为卷积神经网络;步骤四:将步骤三中抽取的特征依次连接,通过稀疏性激活函数后作为softmax的输入,输出得到每个类别的概率,所有类别的概率的和为1,概率值最大的类别为所预测的类别,这个类别作为联合深度学习模型的结果。 |