发明名称 基于压缩感知的鲁棒性语音情感识别方法
摘要 本发明公开了一种基于压缩感知的鲁棒性语音情感识别方法,包含如下步骤:产生含噪声的情感语音样本、建立声学特征提取模块、构建稀疏表示分类器模型、输出语音情感识别结果;有益效果是:充分考虑到自然环境中的情感语音通常会受到噪声的影响,提供一种噪声背景下的鲁棒性语音情感识别方法;充分考虑到不同类型特征参数的有效性,将特征参数的提取从韵律特征和音质特征两方面,扩充到梅尔频率倒谱系数MFCC,进一步提高特征参数的抗噪声效果;利用压缩感知理论中的稀疏表示的判别性,提供一种高性能的基于压缩感知理论的鲁棒性语音情感识别方法。
申请公布号 CN103021406A 申请公布日期 2013.04.03
申请号 CN201210551585.7 申请日期 2012.12.18
申请人 台州学院;赵小明;张石清 发明人 赵小明;张石清
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/08(2006.01)I;G10L25/03(2013.01)I;G10L25/63(2013.01)I 主分类号 G10L15/02(2006.01)I
代理机构 杭州赛科专利代理事务所 33230 代理人 曹绍文
主权项 一种基于压缩感知的鲁棒性语音情感识别方法,其特征在于,该方法包含如下步骤:产生含噪声的情感语音样本、建立声学特征提取模块、构建稀疏表示分类器模型、输出语音情感识别结果;(1)产生含噪声的情感语音样本,包括:将情感语音样本库的所有语音样本,分为训练样本和测试样本两部分,然后对每一个训练样本和测试样本都添加高斯白噪声,从而产生含噪声的情感语音样本;(2)建立声学特征提取模块,包括:将含噪声的情感语音样本进行声学特征提取,该声学特征提取模块包括三部分:韵律特征参数提取、音质特征参数提取、梅尔频率倒谱系数MFCC提取;(2‑1)韵律特征参数提取,包括:基频、振幅和发音持续时间;(2‑2)音质特征参数提取,包括:共振峰、频带能量分布、谐波噪声比和短时抖动参数;(2‑3)梅尔频率倒谱系数MFCC提取,包括:提取13维MFCC特征及其一阶和二阶导数参数,然后计算出它们的平均值和标准差;(3)构建稀疏表示分类器模型,包括:通过声学特征提取模块,每一个情感语音样本都对应着一个由提取的声学特征参数所构成的特征矢量;将所有情感语音样本所对应的特征矢量都输入到稀疏表示分类器中,用于构建稀疏表示分类器模型; 构建稀疏表示分类器的方法是,首先采用稀疏分解的方法,用训练样本对测试样本进行最稀疏表示,即把训练样本看作为一组基,通过求解1‑范数最小化的方法得到测试样本的最稀疏表示系数,最后用测试样本与稀疏表示后的残差来进行分类;(4)输出语音情感识别结果,包括:通过稀疏表示分类器的训练和测试,输出语音情感识别结果,情感识别测试中采用10次交叉检验技术,即所有语句被平分为10份,每次使用其中的9份数据用于训练,剩下的1份数据用于测试,这样的识别实验过 程相应重复10次,最后取10次的平均值作为识别结果。
地址 318000 浙江省台州市市府大道1139号