发明名称 包括最大可能性方法而依据特征声音的说话者与环境适应技术
摘要 一组说话者依赖性模式系在一比较大数量之训练说话者上被训练,以及模式参数系以一预先界定之顺序摘取以建立一组超矢量,每一说话者一组。主要成份分析系随后在一组超矢量上实施以产生一组本微矢量,此本微矢量界定口声语音空间。如果希望时,若干矢量可以减缩以达成数据压缩。此后,一新说话者提供适应数据,以最大可能性之预估为基础藉强迫此一超矢量成为本微声音空间以内,一超矢量系自此适应数据而构成。此一新说话者之本徵空间内之产生之系数随后可以被使用以建立一组新的模式参数,用于该说话者之适当模式系自此模式参数建立。环境适应可以藉包括训练数据中之环境变化来实施。
申请公布号 TW436758 申请公布日期 2001.05.28
申请号 TW088106954 申请日期 1999.04.29
申请人 松下电器产业股份有限公司 发明人 派屈克.恩古颜;罗朗.库;珍克劳德.琼魁
分类号 G10L3/00 主分类号 G10L3/00
代理机构 代理人 恽轶群 台北巿南京东路三段二四八号七楼;陈文郎 台北巿南京东路三段二四八号七楼
主权项 1.一种用以实施说话者调适之方法,包含之步骤为:建立一本微空间,藉提供一组用于该训练说话者之模式,并在该组模式上实施主要成份分析,以产生一组界定该本微空间之主要成份矢量,而以代表多个训练说话者;产生一适应之模式,利用自一新说话者之输入语言以训练该适应之模式,同时使用该组主要成份矢量以约束该适应之模式,因此,该适应之模式置于该本微空间内。2.如申请专利范围第1项之方法,其中该用于训练说话者之模式界定多个模式参数,以及建立一本微空间之步骤包含为该多个训练说话者连锁该模式参数以建立之组超矢量,以及实施主要成份分析于该超矢量上以由是而产生该主要成份矢量。3.如申请专利范围第2项之方法,其中用于每一该训练说话者之该模式相当于一组不同之语言单位,以及其中每一超矢量系作为相当于被贮存在一预定顺序内之该语言单位之模式参数之连锁而被界定。4.如申请专利范围第2项之方法,其中该模式参数系倒频谱(cepstral)系数。5.如申请专利范围第2项之方法,其中该模式参数系滤波器组系数。6.如申请专利范围第1项之方法,其中实施主要成份分析之步骤产生一组主要成份矢量在数目上相等于训练说话者之数目。7.如申请专利范围第1项之方法,其中实施主要成份分析之步骤产生主要成份矢量之顺序表,以及其中建立一本徵空间之步骤包括取消该顺序表之预定部分以减少该本徵空间之范围。8.如申请专利范围第1项之方法,其中建立该适应模式之步骤系藉投影该输入语言进入该本徵空间内而实施。9.如申请专利范围第1项之方法,其中约束该适应模式之步骤系藉以该输入语言为依据选择本徵空间内之一点而实施。10.一种用以实施说话者调适之方法,包含之步骤为:建立一本徵空间,藉提供一组用于该训练说话者之模式,并在该组模式上实施主要成份分析,以产生一组界定该本徵空间之主要成份矢量,而以代表多个训练说话者:产生一适应之模式,使用自一新说话者之输入语言以产生一最大可能性矢量,并以训练该适应之模式,同时使用该组主要成份矢量以及该最大可能性矢量以如此地约束该适应之模式,即该适应之模式置于该本徵空间内。11.如申请专利范围第10项之方法,其中产生一最大可能性矢量之步骤包含:界定一辅助函数代表为一预先界定之一组模式产生一观察之数据资料之概率,其中该输入语言供应该观察之数据资料,以及最大化该辅助函数以找出该最大可能性矢量。12.如申请专利范围第10项之方法,其中该适当之模式系以该主要成份矢量乘该最大可能性矢量而被约束。13.如申请专利范围第11项之方法,其中该最大化步骤系藉下列各项实施:表示该最大可能性矢量作为一组可变本徵値;采取以该可变本徵値为准之辅助函数之一第一衍生値;当该第一衍生値系相等于零时,为该可变本徵质之相对应値寻求解答。图式简单说明:第一图说明一示范性隐藏马尔可夫模式(HMM)之有助于了解本发明者;第二图系一数据流程图,说明如何自多个训练说话者来建构一本徵空间;第三图系一数据流程图,说明一适应模式如何系使用依照本发明之本徵语音而建构;第四图系本徵空间之一简化(两维)之说明,比较此投影操作与本发明之最大可能性操作;第五图系一数据结构图,说明如何自一新说话者之观察数据系通过本徵空间而变换成为依照本发明之一适应模式;以及第六图系一流程图,说明本发明之最大可能性本徵空间适应程序。
地址 日本
您可能感兴趣的专利