发明名称 基于卷积神经网络的短文本分类方法
摘要 本发明是一种基于卷积神经网络的短文本分类方法,该卷积神经网络共分五层:第一层,获取短文本中的多尺度候选语义单元;第二层,计算每一个候选语义单元与向量空间中所有词表示向量的欧式距离并找出最近邻的词表示,选择所有满足欧式距离预设阈值的最近邻词表示构建语义扩展矩阵;第三层,用多个不同宽度、不同权值的核矩阵分别对短文本的映射矩阵和语义扩展矩阵进行二维卷积运算提取局部卷积特征并生成多层局部卷积特征矩阵;第四层,对多层局部卷积特征矩阵进行下采样并得到多层全局特征矩阵,将所述全局特征矩阵进行非线性正切变换并转换为定长的语义特征向量;第五层,将语义特征向量赋予分类器,对短文本的类别进行预测。
申请公布号 CN104834747A 申请公布日期 2015.08.12
申请号 CN201510271672.0 申请日期 2015.05.25
申请人 中国科学院自动化研究所 发明人 徐博;王鹏;王方圆;郝红卫
分类号 G06F17/30(2006.01)I;G06F3/02(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种基于卷积神经网络的短文本分类方法,其特征在于包括以下步骤:步骤1:在卷积神经网络的第一层,获取输入短文本中每一个词的向量化表示并组成映射矩阵;利用所述映射矩阵和权值为1的核矩阵进行一维卷积运算,检测出所述短文本中潜在的多尺度候选语义单元;步骤2:在卷积神经网络的第二层,计算所述候选语义单元与向量空间中所有词表示向量的欧式距离,并找出每个候选语义单元最近邻词表示;选出所有满足欧式距离预设阈值条件的最近邻词表示,构建语义扩展矩阵,作为所述短文本的扩展信息;步骤3:在卷积神经网络的第三层,使用多个不同宽度、包含不同权值的核矩阵分别对所述短文本的映射矩阵和语义扩展矩阵进行二维卷积运算,提取局部卷积特征,并生成多层局部卷积特征矩阵;步骤4:在卷积神经网络的第四层,使用k‑max pooling算法对多层局部卷积特征矩阵进行下采样,得到所述短文本的全局特征矩阵;将全局特征矩阵进行非线性正切变换,并将变换后的特征矩阵转换为语义特征向量;步骤5:在卷积神经网络的输出层,将短文本的语义特征向量赋予分类器,对短文本的类别进行预测。
地址 100190 北京市海淀区中关村东路95号