发明名称 适应说话人无关语音识别数据库的方法和系统
摘要 本发明公开一种用于生成语音识别声学模板数据库的方法和系统,该数据库可以同时适用于说话人相关以及说话人无关语音识别。所得出的数据库可以在轻微降低说话人无关语音识别性能的同时显著地提高说话人相关语音识别的性能。该方法包括如下步骤:从第一说话人接收训练语音波形(步骤105);把训练语音波形分割成对应于隐含马尔可夫模型(HMM)的状态的块(步骤115);对每个所述HMM状态计算说话人相关的高斯概率密度函数(PDF)(步骤120);在说话人无关声学模板数据库中,对每个所述HMM状态,用说话人相关PDF替代所述说话人无关PDF,其中所述说话人无关声学模板数据库包括多个说话人无关HMM,其中每个HMM包括多个高斯PDF,每个PDF都有原始的权重系数(步骤125);和在所述说话人无关的声学模板数据库中为每个所述说话人无关和说话人相关PDF计算新的权重系数。
申请公布号 CN1295675C 申请公布日期 2007.01.17
申请号 CN200310118283.1 申请日期 2003.12.09
申请人 摩托罗拉公司 发明人 张亚昕;何昕;任晓林;孙放;吴边
分类号 G10L15/14(2006.01) 主分类号 G10L15/14(2006.01)
代理机构 中原信达知识产权代理有限责任公司 代理人 谢丽娜;张天舒
主权项 1.一种用于生成可以同时适用于说话人相关和说话人无关语音识别的语音识别声学模板数据库的方法,所述方法包括如下步骤:从第一说话人接收训练语音波形;把所述训练语音波形分割成对应于隐含马尔可夫模型HMM的状态的块;对每个所述HMM状态计算对应于所述第一说话人的说话人相关高斯概率密度函数PDF;在说话人无关声学模板数据库中,对每个所述HMM状态,用所述说话人相关PDF替换说话人无关PDF,其中所述说话人无关声学模板数据库包括多个说话人无关HMM,其中每个HMM包括多个高斯PDF,每个PDF拥有一个原始的权重系数;和在所述说话人无关声学模板数据库中,为每个所述说话人无关和说话人相关PDF计算新的权重系数。
地址 美国伊利诺斯州