发明名称 一种基于无监督域适应的语音情感识别方法
摘要 本发明公开了一种基于无监督域适应的语音情感识别方法,提出的模型包括:特征提取,情感标签预测,域标签预测。特征提取:首先将原始输入数据分解成两块特征,情感判别特征和情感无关特征,然后将情感判别特征进行层次非线性转换得到高层情感特征。将高层情感特征用于情感标签和域标签的预测。利用梯度下降法对整个模型的参数进行更新,得到特征提取层的各层权重。然后,进行特征提取,源域有标签样本通过训练好的特征提取层得到高层情感特征。最后,进行分类器SVM的训练,将源域有标签样本的高层情感特征和相对应的情感标签输入到SVM中训练,训练好的SVM可用于目标域测试样本的分类。解决了语音情感识别中训练样本和测试样本数据分布不同的问题。
申请公布号 CN106469560A 申请公布日期 2017.03.01
申请号 CN201610600762.4 申请日期 2016.07.27
申请人 江苏大学 发明人 毛启容;薛文韬;高利剑;N.鲁瓦;申自强;詹永照
分类号 G10L25/63(2013.01)I;G10L17/02(2013.01)I 主分类号 G10L25/63(2013.01)I
代理机构 代理人
主权项 一种基于无监督域适应的语音情感识别方法,其特征在于,包括如下步骤:S1,语音样本预处理:按照INTERSPEECH 2009情感挑战赛的要求,利用开源工具包openEAR从原始语音样本中提取384维特征,替代原始语音样本作为输入数据;S2,模型训练:所述模型包括三部分:特征提取,情感标签预测,域标签预测;源域的有标签样本和目标域的无标签训练样本通过S1得到相应的384维特征作为模型的输入数据;具体实现包括如下:在模型的特征提取层,输入数据通过不同的权重映射成两种特征:情感判别特征和情感无关特征;然后情感判别特征通过层次非线性转换得到高层情感特征;源域有标签样本的高层情感特征用于情感标签的预测,源域和目标域样本的高层情感特征用于域标签的预测;最后更新模型的参数,将两个标签预测器的损失进行反向传播,用梯度下降法进行参数的更新;S3,特征提取:利用S2中训练好的特征提取层的参数,将源域有标签训练样本的384维特征转换成高层情感特征;S4,分类器训练:利用S3中源域有标签训练样本的高层情感特征和相对应的情感标签,进行分类器SVM的训练;S5,语音情感识别:对任意一个目标域的语音测试样本,首先利用步骤S1提取384维特征作为输入数据,然后通过S2中训练好的特征提取层得到高层情感特征,最后输入到S4训练好的SVM中进行分类。
地址 212013 江苏省镇江市京口区学府路301号