发明名称 改进依赖上下文的语音识别器对环境变化的鲁棒性
摘要 本发明涉及改进依赖上下文的语音识别器对环境变化的鲁棒性。一种改进用于应用的依赖上下文的语音识别器对环境变化的鲁棒性的装置,其包括存储用于语音识别训练的声音的训练数据库,存储语音识别器所支持的单词的字典,以及利用训练数据库和字典对一个或多个多状态隐马尔可夫模型(HMM)的集合进行训练的语音识别器训练模块。所述语音识别器训练模块对每个HMM的每个状态执行非统一状态集群化过程,其中包括对每个HMM的至少一些状态使用不同的非统一集群阈值以更重度地集群化并相应减少在经验上受一种或多种上下文依赖性影响较小的每个HMM的状态中的那些状态的观察分布数目。
申请公布号 CN102254555B 申请公布日期 2013.06.19
申请号 CN201110031004.2 申请日期 2011.01.28
申请人 索尼电脑娱乐公司 发明人 X.梅宁德斯-皮达尔;R.陈
分类号 G10L15/14(2006.01)I 主分类号 G10L15/14(2006.01)I
代理机构 中国专利代理(香港)有限公司 72001 代理人 刘春元;蒋骏
主权项 一种改进用于应用的依赖上下文的语音识别器对环境变化的鲁棒性的装置,包括:存储用于语音识别训练的声音的训练数据库;存储依赖上下文的语音识别器所支持的多个单词的字典;以及利用训练数据库和字典对一个或多个多状态隐马尔可夫模型(HMM)的集合进行训练的语音识别器训练模块,其中所述语音识别器训练模块进一步对每个HMM的每个状态执行非统一状态集群化过程,所述非统一状态集群化过程对每个HMM的至少一些状态使用不同的非统一集群阈值以更重度地集群化并相应减少受一种或多种上下文依赖性影响较小的每个HMM的状态中的那些状态的观察分布的数目。
地址 日本东京都