发明名称 一种用于语音情感识别的自学语谱图特征提取方法
摘要 本发明公开了一种用于语音情感识别的自学语谱图特征提取方法,首先对已知情感的标准语料库中的语音进行预处理,得到量化后的语谱图灰度图像;然后计算所得到的语谱图灰度图像的Gabor语谱图;再采用可辨别特征学算法对提取到的LBP统计直方图进行训练,构建不同尺度、不同方向下的全局显著性模式集合;最后采用全局显著性集合对语音不同尺度、不同方向下Gabor图谱的LBP统计直方图进行特征选择,得到处理后的统计直方图,将N个统计直方图级联,得到适合情感分类的语音情感特征。本发明提出的情感特征可以较好地识别不同种类的情感,识别率显著优于现有的声学特征。
申请公布号 CN105047194A 申请公布日期 2015.11.11
申请号 CN201510450338.1 申请日期 2015.07.28
申请人 东南大学 发明人 赵力;陶华伟;魏昕;梁瑞宇;查诚;张昕然
分类号 G10L15/10(2006.01)I;G10L15/20(2006.01)I 主分类号 G10L15/10(2006.01)I
代理机构 南京瑞弘专利商标事务所(普通合伙) 32249 代理人 陈国强
主权项 一种用于语音情感识别的自学习语谱图特征提取方法,其特征在于:包括以下步骤:(1)、对已知情感的标准语料库中的语音进行预处理,得到量化后的语谱图灰度图像;(2)、计算步骤(1)所得到的语谱图灰度图像的Gabor语谱图;(3)、采用可辨别特征学习算法对步骤(2)提取到的LBP统计直方图进行训练,构建不同尺度、不同方向下的全局显著性模式集合,记为<img file="FDA0000769054510000011.GIF" wi="324" he="85" />(4)、采用步骤(3)中的全局显著性模式<img file="FDA0000769054510000012.GIF" wi="296" he="85" />对语音不同尺度、不同方向下Gabor图谱的LBP统计直方图进行特征选择,得到处理后的统计直方图<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mn>1</mn></msubsup><mo>,</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mn>2</mn></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mi>N</mi></msubsup><mo>,</mo></mrow>]]></math><img file="FDA0000769054510000013.GIF" wi="393" he="90" /></maths>将N个统计直方图级联<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><msub><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow></msub><mo>^</mo></mover><mo>=</mo><mo>&lsqb;</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mn>1</mn></msubsup><mo>,</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mn>2</mn></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mi>N</mi></msubsup><mo>&rsqb;</mo><mo>,</mo></mrow>]]></math><img file="FDA0000769054510000014.GIF" wi="564" he="113" /></maths>得到适合情感分类的语音情感特征。
地址 211189 江苏省南京市江宁区东南大学路2号