发明名称 应用于语音辨认之语音模型训练方法
摘要 本发明提供一种应用于语音辨认之语音模型训练方法,首先系将输入语音分离模型化成为一乾净声音之密实语音模型及一环境因素模型,而后根据该环境因素模型将输入语音中之环境杂讯滤除以得到一环境效应抑制的语音讯号,接着再将此语音讯号与密实语音模型,利用监别式训练法演算而得到一高监别度且密实的语音训练模型,以提供语音辨认装置进行后续之语音辨认处理。因此利用本发明演算得之语音训练模型同时兼具有强健能力及监别能力,进而具有高辨识率之优点,且适用于杂讯环境的补偿辨认,并可达到精准之环境效应调适。
申请公布号 TWI223792 申请公布日期 2004.11.11
申请号 TW092107779 申请日期 2003.04.04
申请人 蒙恬科技股份有限公司 发明人 洪维廷
分类号 G10L15/06 主分类号 G10L15/06
代理机构 代理人 林火泉 台北市大安区忠孝东路四段三一一号十二楼之一
主权项 1.一种应用于语音辨认之语音模型训练方法,包括下列步骤:将输入语音分离成为一乾净声音之密实语音模型及一环境因素模型;根据该环境因素模型将该输入语音中之环境因素滤除而得到一语音讯号;以及将该语音讯号套入该密实语音模型中,且利用监别式训练法演算而得到一语音训练模型,以提供语音辨认装置进行后续之语音辨认处理。2.如申请专利范围第1项所述之语音模型训练方法,其中,该环境因素模型之讯号系包括通道讯号及杂讯。3.如申请专利范围第2项所述之语音模型训练方法,其中,该通道讯号系包括麦克风通道效应。4.如申请专利范围第2项所述之语音模型训练方法,其中,该通道讯号系包括语者偏差値(speaker bias)。5.如申请专利范围第1项所述之语音模型训练方法,其中,该监别式训练法系通用型或然性下降训练法(generalized probabilistic descent,GPD)。6.如申请专利范围第1项所述之语音模型训练方法,其中,分离该输入语音之步骤系藉由比较类神经网路非语音输出与一预定之阀値以侦测出非语音音框,且将此非语音音框套用于计算线上(on-line)杂讯模型上。7.如申请专利范围第1项所述之语音模型训练方法,其中,滤除该环境因素之步骤系利用一滤波器进行。8.如申请专利范围第1项所述之语音模型训练方法,其中,滤除该环境因素之步骤更包括:利用状态式维纳滤波方法(state-based Wiener filteringmethod)处理该输入语音以使该密实语音模型进而成为一增强状态组态之语音;将该增强状态组态之语音转换为一倒频谱频域(Cepstrum Domain),以藉由讯号偏差补偿(signal biascompensation)方法估算偏差値,而将该密实语音模型转换为偏压补偿式语音模型;以及利用平行模型结合法(parallel model combination)且使用一线上杂讯模型将被该偏压补偿式语音模型转换为杂讯及偏压补偿式语音模型。9.如申请专利范围第8项所述之语音模型训练方法,其中,在该讯号偏压补偿方法中,系先使用代码本将该增强状态组态之语音的特征向量进行转码,再计算平均转码剩余値,其中代码本系藉由收集该等密实语音模型中混合组成的平均向量而形成。图式简单说明:第一(a)图至第一(b)图为本发明于建立语音模型训练方法之架构示意图。第二图为具体使用本发明之训练方法与习知训练方法之辨识结果比较示意图。第三图为具体使用本发明之训练方法与习知训练方法之另一辨识结果比较示意图。
地址 新竹市光复路二段二巷四十七号七楼