发明名称 电话语音识别中的自适应方法
摘要 本发明涉及一种电话语音识别中的自适应方法,包括,预处理过程和自适应更新过程;所述预处理过程是根据采集的多个说话人样本数据的性别、口音、年龄特征形成一个决策树,该决策树的每个叶节点中记录一个语音类的高斯混合模型、隐马尔科夫声学模型以及用于目标语音特征参数与声学模型相互匹配的变换矩阵;所述自适应更新过程包括:1)对输入的目标语音进行分类,将目标语音归入一个叶节点或建立一个新的叶节点;2)更新目标语音所在叶节点上的变换矩阵;3)根据变换矩阵更新目标语音的特征参数或/和更新该目标语音所在叶节点上的隐马尔科夫声学模型。本发明的优点是:大大节省了存储空间,加快了计算速度,特别适用于电话语音识别系统。
申请公布号 CN101123648A 申请公布日期 2008.02.13
申请号 CN200610089253.6 申请日期 2006.08.11
申请人 中国科学院声学研究所;北京中科信利技术有限公司 发明人 刘晓星;韩疆;潘接林;颜永红
分类号 H04M3/493(2006.01) 主分类号 H04M3/493(2006.01)
代理机构 北京泛华伟业知识产权代理有限公司 代理人 王凤华
主权项 1.一种电话语音识别中的自适应方法,包括预处理过程和自适应更新过程;其特征在于,所述预处理过程是根据采集的各说话人样本数据的性别、口音、年龄特征建立一个决策树,该决策树的每个叶节点中记录一个语音类的高斯混合模型、隐马尔科夫声学模型以及用于目标语音特征参数与声学模型相互匹配的变换矩阵;所述自适应更新过程包括:1)利用高斯混合模型对输入的目标语音进行分类,将目标语音归入一个叶节点,或以该目标语音为初始语音在决策树中建立一个新的叶节点;2)更新目标语音所在叶节点上的变换矩阵;3)根据变换矩阵更新目标语音的特征参数或/和更新该目标语音所在叶节点上的隐马尔科夫声学模型。
地址 100080北京市海淀区北四环西路21号