基于多元核logistic回归模型的说话人辨别实现方法,申请号CN200910152591.3-传众专利搜索

发明名称	基于多元核logistic回归模型的说话人辨别实现方法
摘要	一种基于多元核logistic回归模型的说话人辨别实现方法，包括以下步骤：A)说话人语音特征提取：采集待识别说话人语音信号，进行预处理；再提取梅尔倒谱参数；B)说话人模型构建：采用多元核logistic回归模型作为说话人辨别模型；C)说话人辨别模型训练：将步骤A所提取的特征向量作为输入训练样本，通过最小序列优化算法进行迭代训练，使模型参数达到最优；D)说话人辨别：提取待辨别说话人语音信号的特征向量，并输入经过训练的说话人辨别模型，多元核logistic回归模型会给出每个说话人的后验概率，概率值最高者为识别结果。本发明识别率高、模型构建简单、具有良好的快速性。
申请公布号	CN101650945A	申请公布日期	2010.02.17
申请号	CN200910152591.3	申请日期	2009.09.17
申请人	浙江工业大学	发明人	王万良;郑建炜;郑泽萍;韩姗姗;蒋一波;王震宇;王磊;陈胜勇
分类号	G10L17/00(2006.01)I	主分类号	G10L17/00(2006.01)I
代理机构	杭州天正专利事务所有限公司	代理人	王兵;王利强
主权项	1、一种基于多元核logistic回归模型的说话人辨别实现方法，其特征在于：所述说话人辨别实现方法包括以下步骤：A)、说话人语音特征提取：采集待识别说话人语音信号，进行预处理；再提取梅尔倒谱参数，所述梅尔倒谱参数为13阶倒谱参数，将其中描述说话人个性特征较弱的第零阶系数去除，余下12维特征向量作为说话人辨别输入向量；B)、说话人模型构建：采用多元核logistic回归模型作为说话人辨别模型，<maths num="0001"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>i</mi></msub><mo>=</mo><mi>k</mi><mo>\|</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>;</mo><mi>β</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>exp</mi><mrow><mo>(</mo><msup><msub><mi>β</mi><mi>k</mi></msub><mi>T</mi></msup><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>+</mo><msub><mi>β</mi><mrow><mi>k</mi><mn>0</mn></mrow></msub><mo>)</mo></mrow></mrow><mrow><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><mi>exp</mi><mrow><mo>(</mo><msup><msub><mi>β</mi><mi>j</mi></msub><mi>T</mi></msup><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>+</mo><msub><mi>β</mi><mrow><mi>j</mi><mn>0</mn></mrow></msub><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow></math>]]></maths>k＝1，2，…K其中，K为需辨别说话人数目，x为12维输入特征向量，β＝{β<sub>1</sub>，β<sub>2</sub>，…，β<sub>K</sub>}<sup>T</sup>为总体模型参数；β<sub>k</sub>为第k个说话人相应的模型参数，β<sub>k0</sub>为第k个说话人相应的模型常量参数，c<sub>i</sub>为第i个语音特征向量相应的说话人目标；C)、说话人辨别模型训练：将步骤A所提取的特征向量作为输入训练样本，通过最小序列优化算法进行迭代训练，使模型参数达到最优；D)、说话人辨别：提取待辨别说话人语音信号的特征向量，并输入经过训练的说话人辨别模型，多元核logistic回归模型会给出每个说话人的后验概率，概率值最高者为识别结果。
地址	310014浙江省杭州市下城区朝晖六区