发明名称 基于多元核logistic回归模型的说话人辨别实现方法
摘要 一种基于多元核logistic回归模型的说话人辨别实现方法,包括以下步骤:A)说话人语音特征提取:采集待识别说话人语音信号,进行预处理;再提取梅尔倒谱参数;B)说话人模型构建:采用多元核logistic回归模型作为说话人辨别模型;C)说话人辨别模型训练:将步骤A所提取的特征向量作为输入训练样本,通过最小序列优化算法进行迭代训练,使模型参数达到最优;D)说话人辨别:提取待辨别说话人语音信号的特征向量,并输入经过训练的说话人辨别模型,多元核logistic回归模型会给出每个说话人的后验概率,概率值最高者为识别结果。本发明识别率高、模型构建简单、具有良好的快速性。
申请公布号 CN101650945A 申请公布日期 2010.02.17
申请号 CN200910152591.3 申请日期 2009.09.17
申请人 浙江工业大学 发明人 王万良;郑建炜;郑泽萍;韩姗姗;蒋一波;王震宇;王磊;陈胜勇
分类号 G10L17/00(2006.01)I 主分类号 G10L17/00(2006.01)I
代理机构 杭州天正专利事务所有限公司 代理人 王 兵;王利强
主权项 1、一种基于多元核logistic回归模型的说话人辨别实现方法,其特征在于:所述说话人辨别实现方法包括以下步骤:A)、说话人语音特征提取:采集待识别说话人语音信号,进行预处理;再提取梅尔倒谱参数,所述梅尔倒谱参数为13阶倒谱参数,将其中描述说话人个性特征较弱的第零阶系数去除,余下12维特征向量作为说话人辨别输入向量;B)、说话人模型构建:采用多元核logistic回归模型作为说话人辨别模型,<maths num="0001"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>i</mi></msub><mo>=</mo><mi>k</mi><mo>|</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>;</mo><mi>&beta;</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>exp</mi><mrow><mo>(</mo><msup><msub><mi>&beta;</mi><mi>k</mi></msub><mi>T</mi></msup><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>+</mo><msub><mi>&beta;</mi><mrow><mi>k</mi><mn>0</mn></mrow></msub><mo>)</mo></mrow></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><mi>exp</mi><mrow><mo>(</mo><msup><msub><mi>&beta;</mi><mi>j</mi></msub><mi>T</mi></msup><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>+</mo><msub><mi>&beta;</mi><mrow><mi>j</mi><mn>0</mn></mrow></msub><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow></math>]]></maths>k=1,2,…K其中,K为需辨别说话人数目,x为12维输入特征向量,β={β<sub>1</sub>,β<sub>2</sub>,…,β<sub>K</sub>}<sup>T</sup>为总体模型参数;β<sub>k</sub>为第k个说话人相应的模型参数,β<sub>k0</sub>为第k个说话人相应的模型常量参数,c<sub>i</sub>为第i个语音特征向量相应的说话人目标;C)、说话人辨别模型训练:将步骤A所提取的特征向量作为输入训练样本,通过最小序列优化算法进行迭代训练,使模型参数达到最优;D)、说话人辨别:提取待辨别说话人语音信号的特征向量,并输入经过训练的说话人辨别模型,多元核logistic回归模型会给出每个说话人的后验概率,概率值最高者为识别结果。
地址 310014浙江省杭州市下城区朝晖六区