基于倒谱特征线性情感补偿的说话人识别方法,申请号CN200510061360.3-传众专利搜索

发明名称	基于倒谱特征线性情感补偿的说话人识别方法
摘要	本发明涉及一种基于倒谱特征线性情感补偿的说话人识别方法，主要步骤是：1)语音信号进行预处理；2)语音帧上的特征提取：在说话人语音上提取倒谱特征MFCC和基音频率，根据基音频率存在与否，将语音信号流分成浊音段和清音段，判断如果某帧为清音帧，则丢弃该帧语音，不予处理；3)依据基音频率的变化对相应帧的MFCC进行线性补偿；4)根据这个使最大似然估计得到的概率最大的系数对MFCC进行补偿，由补偿后的语音特征进行训练；5)识别。本发明有益的效果是：采用基于基音频率的倒谱特征补偿，利用韵律特征在情感语音中的变化规律，对情感语音的MFCC特征进行补偿后使说话人特征更具稳定性，以尽量减少情感影响带来的说话人自身语音差异。
申请公布号	CN1758332A	申请公布日期	2006.04.12
申请号	CN200510061360.3	申请日期	2005.10.31
申请人	浙江大学	发明人	吴朝晖;杨莹春;吴甜
分类号	G10L17/00(2006.01);G10L15/00(2006.01);G10L15/02(2006.01);G10L15/06(2006.01);G10L15/08(2006.01)	主分类号	G10L17/00(2006.01)
代理机构	杭州九洲专利事务所有限公司	代理人	陈继亮
主权项	1、一种基于倒谱特征线性情感补偿的说话人识别方法，其特征在于：主要步骤是：1)、语音信号进行预处理：主要包括采样与量化、预加重处理和加窗；2)、语音帧上的特征提取：在说话人语音上提取倒谱特征MFCC和基音频率，根据基音频率存在与否，将语音信号流分成浊音段和清音段，判断如果某帧为清音帧，则丢弃该帧语音，不予处理；3)、依据基音频率的变化对相应帧的MFCC进行线性补偿，其间不断调整补偿系数使EM算法中的最大似然估计得到的概率值最大，并由此确定补偿系数；4)、根据这个使最大似然估计得到的概率最大的系数对MFCC进行补偿，由补偿后的语音特征进行训练；5)、识别：用于语音输入后，经特征提取，得到一特征向量序列，该序列输入到相关用户模型参数的GMM中，得到相似度值并根据其给用户打分。
地址	310027浙江省杭州市西湖区浙大路38号浙江大学计算机学院曹光彪东楼505室