发明名称 上下文相关的汉语语音识别建模方法
摘要 一种上下文相关的汉语语音识别建模方法,基于汉语的语言特点,采用声母右相关和韵母左相关的建模方法,包括步骤:(a)将汉语语音的声母与紧邻其右侧的韵母相关,而韵母与紧邻其左侧的声母相关,创建上下文相关的基本建模单元;(b)利用状态聚类法对模型的参数进行训练,以得到初始隐马尔可夫模型(HMM);(c)利用子空间聚类算法对初始隐马尔可夫模型进行压缩,以产生最终模型。
申请公布号 CN1655232B 申请公布日期 2010.04.21
申请号 CN200410004131.3 申请日期 2004.02.13
申请人 松下电器产业株式会社 发明人 贾磊;马龙
分类号 G10L15/00(2006.01)I 主分类号 G10L15/00(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 王玮
主权项 一种汉语语音识别建模方法,包括步骤:(a)将汉语语音的声母与紧邻其右侧的韵母相关,而韵母与紧邻其左侧的声母相关,创建上下文相关的基本建模单元;(b)利用状态聚类法对模型的参数进行训练,计算任何两个状态之间进行合并所造成的似然概率的损失;(c)从步骤b中计算过的所有可能的状态合并成的集合中寻找似然概率损失最小的两个状态类的合并,并判断这两个状态类的样本数目是否大于一个固定的阈值;(d)如果判断这两个状态类的样本数目大于一个固定的阈值,则将此合并从所有可能的状态合并的集合中删除;如果这两个状态类中至少有一个状态类的样本数目小于该固定的阈值,则将这两个状态类合并起来生成一个新的状态类,新的状态类的特征空间重新用两个混合的高斯混合模型进行描述;(e)判断每个状态类的样本数目是否大于另一个固定的阈值,如果大于所述另一个固定阈值,则采用状态聚类算法对合并后的各状态输出分布的混合高斯模型进行参数估计;如果至少一个状态的样本数目不大于所述另一个固定阈值,则返回到步骤(b),由此得到初始隐马尔可夫模型;和(f)利用子空间聚类算法对初始隐马尔可夫模型进行压缩,以产生最终模型。
地址 日本大阪府