一种用于语音情感识别的自学语谱图特征提取方法,申请号CN201510450338.1-传众专利搜索

发明名称	一种用于语音情感识别的自学语谱图特征提取方法
摘要	本发明公开了一种用于语音情感识别的自学语谱图特征提取方法，首先对已知情感的标准语料库中的语音进行预处理，得到量化后的语谱图灰度图像；然后计算所得到的语谱图灰度图像的Gabor语谱图；再采用可辨别特征学算法对提取到的LBP统计直方图进行训练，构建不同尺度、不同方向下的全局显著性模式集合；最后采用全局显著性集合对语音不同尺度、不同方向下Gabor图谱的LBP统计直方图进行特征选择，得到处理后的统计直方图，将N个统计直方图级联，得到适合情感分类的语音情感特征。本发明提出的情感特征可以较好地识别不同种类的情感，识别率显著优于现有的声学特征。
申请公布号	CN105047194A	申请公布日期	2015.11.11
申请号	CN201510450338.1	申请日期	2015.07.28
申请人	东南大学	发明人	赵力;陶华伟;魏昕;梁瑞宇;查诚;张昕然
分类号	G10L15/10(2006.01)I;G10L15/20(2006.01)I	主分类号	G10L15/10(2006.01)I
代理机构	南京瑞弘专利商标事务所(普通合伙) 32249	代理人	陈国强
主权项	一种用于语音情感识别的自学习语谱图特征提取方法，其特征在于：包括以下步骤：(1)、对已知情感的标准语料库中的语音进行预处理，得到量化后的语谱图灰度图像；(2)、计算步骤(1)所得到的语谱图灰度图像的Gabor语谱图；(3)、采用可辨别特征学习算法对步骤(2)提取到的LBP统计直方图进行训练，构建不同尺度、不同方向下的全局显著性模式集合，记为<img file="FDA0000769054510000011.GIF" wi="324" he="85" />(4)、采用步骤(3)中的全局显著性模式<img file="FDA0000769054510000012.GIF" wi="296" he="85" />对语音不同尺度、不同方向下Gabor图谱的LBP统计直方图进行特征选择，得到处理后的统计直方图<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mn>1</mn></msubsup><mo>,</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mn>2</mn></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mi>N</mi></msubsup><mo>,</mo></mrow>]]></math><img file="FDA0000769054510000013.GIF" wi="393" he="90" /></maths>将N个统计直方图级联<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><msub><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow></msub><mo>^</mo></mover><mo>=</mo><mo>[</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mn>1</mn></msubsup><mo>,</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mn>2</mn></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>f</mi><mrow><mi>m</mi><mi>a</mi><mi>p</mi></mrow><mi>N</mi></msubsup><mo>]</mo><mo>,</mo></mrow>]]></math><img file="FDA0000769054510000014.GIF" wi="564" he="113" /></maths>得到适合情感分类的语音情感特征。
地址	211189 江苏省南京市江宁区东南大学路2号