一种基于无监督域适应的语音情感识别方法,申请号CN201610600762.4-传众专利搜索

发明名称	一种基于无监督域适应的语音情感识别方法
摘要	本发明公开了一种基于无监督域适应的语音情感识别方法，提出的模型包括：特征提取，情感标签预测，域标签预测。特征提取：首先将原始输入数据分解成两块特征，情感判别特征和情感无关特征，然后将情感判别特征进行层次非线性转换得到高层情感特征。将高层情感特征用于情感标签和域标签的预测。利用梯度下降法对整个模型的参数进行更新，得到特征提取层的各层权重。然后，进行特征提取，源域有标签样本通过训练好的特征提取层得到高层情感特征。最后，进行分类器SVM的训练，将源域有标签样本的高层情感特征和相对应的情感标签输入到SVM中训练，训练好的SVM可用于目标域测试样本的分类。解决了语音情感识别中训练样本和测试样本数据分布不同的问题。
申请公布号	CN106469560A	申请公布日期	2017.03.01
申请号	CN201610600762.4	申请日期	2016.07.27
申请人	江苏大学	发明人	毛启容;薛文韬;高利剑;N．鲁瓦;申自强;詹永照
分类号	G10L25/63(2013.01)I;G10L17/02(2013.01)I	主分类号	G10L25/63(2013.01)I
代理机构		代理人
主权项	一种基于无监督域适应的语音情感识别方法，其特征在于，包括如下步骤：S1，语音样本预处理：按照INTERSPEECH 2009情感挑战赛的要求，利用开源工具包openEAR从原始语音样本中提取384维特征，替代原始语音样本作为输入数据；S2，模型训练：所述模型包括三部分：特征提取，情感标签预测，域标签预测；源域的有标签样本和目标域的无标签训练样本通过S1得到相应的384维特征作为模型的输入数据；具体实现包括如下：在模型的特征提取层，输入数据通过不同的权重映射成两种特征：情感判别特征和情感无关特征；然后情感判别特征通过层次非线性转换得到高层情感特征；源域有标签样本的高层情感特征用于情感标签的预测，源域和目标域样本的高层情感特征用于域标签的预测；最后更新模型的参数，将两个标签预测器的损失进行反向传播，用梯度下降法进行参数的更新；S3，特征提取：利用S2中训练好的特征提取层的参数，将源域有标签训练样本的384维特征转换成高层情感特征；S4，分类器训练：利用S3中源域有标签训练样本的高层情感特征和相对应的情感标签，进行分类器SVM的训练；S5，语音情感识别：对任意一个目标域的语音测试样本，首先利用步骤S1提取384维特征作为输入数据，然后通过S2中训练好的特征提取层得到高层情感特征，最后输入到S4训练好的SVM中进行分类。
地址	212013 江苏省镇江市京口区学府路301号