发明名称 语音识别系统中的说话人自适应方法
摘要 本发明提供了一种语音识别系统中的说话人自适应方法,称为最大高斯相似度协方差矩阵线性插值方法,能够克服基于高斯相似度的二叉决策树方法中在自适应数据极少的情况下的缺点。本发明主要步骤是:自适应前,首先与基于高斯相似度分析的二叉决策树自适应方法一样,根据非特定人模型建立起协方差矩阵二叉决策树;然后,按照该决策树计算在各特定人模型下中间节点对应的类中心矩阵。自适应时,先由测试者提供的数据量决定,在哪些中间节点上进行插值自适应,接着根据每一待插值的中间节点对应的自适应数据,计算插值系数,最后计算自适应后的类中心矩阵,更新协方差矩阵,得到自适应模型。
申请公布号 CN1521728A 申请公布日期 2004.08.18
申请号 CN03102206.5 申请日期 2003.01.27
申请人 北京天朗语音科技有限公司;清华大学 发明人 吴及;王作英;吕萍
分类号 G10L15/00;G10L15/14;G10L15/06 主分类号 G10L15/00
代理机构 北京万慧达知识产权代理有限公司 代理人 秦开宗
主权项 1、一种语音识别系统中的说话人自适应方法,包括:一个自适应前非特定人隐含马尔可夫模型的训练步骤;一个自适应前建立该非特定人隐含马尔可夫模型状态协方差矩阵的二叉决策树的步骤;一个自适应前计算二叉决策树每个中间节点的类中心协方差矩阵及其与对应的各叶子节点协方差矩阵间的变换关系的步骤;一个自适应时根据测试者提供的自适应数据决定自适应类的步骤;一个对每个自适应类根据自适应数据用最大似然方法估计类中心矩阵的步骤;一个对每个自适应类计算自适应后的类中心协方差矩阵的步骤;一个更新每个自适应类的协方差矩阵,得到说话人自适应模型的步骤;其特征在于:所述的语音识别系统中的说话人自适应方法还包括:一个自适应前多个特定人隐含马尔可夫模型的训练步骤;一个自适应前根据所述二叉决策树计算在各特定人模型下中间节点对应的类中心矩阵的步骤;一个自适应时对每个自适应类计算最优插值系数的步骤;所述的对每个自适应类计算自适应后的类中心协方差矩阵的步骤是以特定人模型类中心矩阵的最大似然估计值和其对应插值系数计算的。
地址 100029北京市朝阳区裕民路12号中国国际科技会展中心A座1701号