一种基于联合深度学模型的文本情感分类方法,申请号CN201611223174.X-传众专利搜索

发明名称	一种基于联合深度学模型的文本情感分类方法
摘要	一种基于联合深度学模型的文本情感分类方法，本发明涉及文本情感分类方法。本发明为了解决现有SVM等浅层分类方法，会带来维数灾难和数据稀疏等问题。步骤为：一：对文本数据中每一个词进行处理，采用word2vec工具对处理后的文本数据中每一个词进行训练，得到词向量字典；二：得到每个句子的矩阵M，LSTM层将矩阵M进行训练转化为固定维度的向量对输入层进行改进，生成d维h个具有上下文语义关系的词向量；三、采用CNN作为一个可训练的特征检测器从d维h个具有上下文语义关系的词向量中抽取特征；四：将抽取的特征依次连接，输出得到每个类别的概率，概率值最大的类别为所预测的类别。本发明用于自然语言处理领域。
申请公布号	CN106599933A	申请公布日期	2017.04.26
申请号	CN201611223174.X	申请日期	2016.12.26
申请人	哈尔滨工业大学	发明人	徐冰;杨沐昀;杨艳;赵铁军;郑德权;朱聪慧;曹海龙
分类号	G06K9/62(2006.01)I;G06F17/30(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	哈尔滨市松花江专利商标事务所 23109	代理人	杨立超
主权项	一种基于联合深度学习模型的文本情感分类方法，其特征在于：所述基于联合深度学习模型的文本情感分类方法包括以下步骤：步骤一：对文本数据中每一个词进行处理，采用word2vec工具对处理后的文本数据中每一个词进行训练，得到词向量字典，其中每一个词都对应着一个词向量；所述word2vec工具为谷歌词向量工具；步骤二：原始输入为词序列(w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>)，得到每个句子的矩阵M，M＝(x<sub>1</sub>,…,x<sub>s‑1</sub>,x<sub>s</sub>,…,x<sub>max</sub>)∈R<sup>d×max</sup>；LSTM层将矩阵M进行训练转化为固定维度的向量对输入层进行改进，生成d维h个具有上下文语义关系的词向量；其中所述w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>为每个句子中每个词所对应的词标号，x<sub>1</sub>,…,x<sub>s‑1</sub>,x<sub>s</sub>,…,x<sub>max</sub>为与w<sub>1</sub>,....,w<sub>s‑1</sub>,w<sub>s</sub>,…,w<sub>max</sub>一一对应的词向量，LSTM为长短期记忆模型；步骤三：将步骤二中生成的d维h个具有上下文语义关系的词向量作为CNN的输入，采用CNN作为一个可训练的特征检测器从d维h个具有上下文语义关系的词向量中抽取特征，所述CNN为卷积神经网络；步骤四：将步骤三中抽取的特征依次连接，通过稀疏性激活函数后作为softmax的输入，输出得到每个类别的概率，所有类别的概率的和为1，概率值最大的类别为所预测的类别，这个类别作为联合深度学习模型的结果。
地址	150001 黑龙江省哈尔滨市南岗区西大直街92号