发明名称 健全语音分类之方法及装置
摘要 一种用以语音改变模式健全分类之语音分类技术,以允许多重模式可变位元率编码技术的最大效率[5027-530]。一语音分类器可正确分类以最小位元率编码之一高百分比的语音片段,而符合较低位元率需求。该高度正确语音分类能产生一较低平均编码位元率、与较高品质解码语音。该语音分类器系考虑语音每讯框的最大量参数,可于每个讯框产生许多及正确的语音模式分类。该语音分类器在可变环境情况下可正确地分类许多语音模式。该语音分类器可从外部元件输入分类参数,从该等输入参数产生内部分类参数,设定一正常化自动关联系数功能临界值、及根据该信号环境而选取一参数分析器,然后,将该等参数分析,以产生一语音模式分类。
申请公布号 TW535141 申请公布日期 2003.06.01
申请号 TW090130379 申请日期 2001.12.07
申请人 奎康公司 发明人 黄平仁
分类号 G10L19/00 主分类号 G10L19/00
代理机构 代理人 陈长文 台北市松山区敦化北路二○一号七楼
主权项 1.一种语音分类之方法,其包含:将分类参数从外部元件输入一语音分类器;在该语音分类器中,从该等输入参数之中至少一者产生内部分类参数;根据一信号环境而设定一正常化自动关联系数功能临界値,并且选取一参数分析器;及分析该等输入参数及该等内部参数,以产生一语音模式分类。2.如申请专利范围第1项之方法,其中该等输入参数包含一杂讯抑制语音信号。3.如申请专利范围第1项之方法,其中该等输入参数包含有关一杂讯抑制语音信号的信号-杂讯比资讯。4.如申请专利范围第1项之方法,其中该等输入参数包含声音活动资讯。5.如申请专利范围第1项之方法,其中该等输入参数包含线性预测反映系数。6.如申请专利范围第1项之方法,其中该等输入参数包含正常化自动关联系数功能资讯。7.如申请专利范围第1项之方法,其中该等输入参数包含音调资讯的正常化自动关联系数功能。8.如申请专利范围第7项之方法,其中音调资讯上的该正常化自动关联系数功能是一阵列値。9.如申请专利范围第1项之方法,其中该等内部参数包含一零交错率参数。10.如申请专利范围第1项之方法,其中该等内部参数包含一目前讯框能量参数。11.如申请专利范围第1项之方法,其中该等内部参数包含一前视讯框能量参数。12.如申请专利范围第1项之方法,其中该等内部参数包含一频带能量比参数。13.如申请专利范围第1项之方法,其中该等内部参数包含三讯框平均声音能量参数。14.如申请专利范围第1项之方法,其中该等内部参数包含一先前三讯框平均声音能量参数。15.如申请专利范围第1项之方法,其中该等内部参数包含一目前讯框能量与先前三讯框平均声音能量比参数。16.如申请专利范围第1项之方法,其中该等内部参数包含一目前讯框能量与三讯框平均声音能量比参数。17.如申请专利范围第1项之方法,其中该等内部参数包含一最大子讯框能量索引参数。18.如申请专利范围第1项之方法,其中该设定一正常化自动关联系数功能临界値包含将一信号杂讯比资讯参数与一预定信号杂讯比値相比较。19.如申请专利范围第1项之方法,其中该分析包含将该等参数应用到一状态机器。20.如申请专利范围第19项之方法,其中该状态机器包含每个语音分类模式的一状态。21.如申请专利范围第1项之方法,其中该语音模式分类包含一暂态模式。22.如申请专利范围第1项之方法,其中该语音模式分类包含一向上暂态模式。23.如申请专利范围第1项之方法,其中该语音模式分类包含一向下暂态模式。24.如申请专利范围第1项之方法,其中该语音模式分类包含一声音模式。25.如申请专利范围第1项之方法,其中该语音模式分类包含一无声音模式。26.如申请专利范围第1项之方法,其中该语音模式分类包含一静音模式。27.如申请专利范围第1项之方法,其进一步包含更新至少一参数。28.如申请专利范围第27项之方法,其中该更新参数包含正在音调参数上的一正常化自动关联系数功能。29.如申请专利范围第27项之方法,其中该更新参数包含三讯框平均声音能量参数。30.如申请专利范围第27项之方法,其中该更新参数包含一前视讯构能量参数。31.如申请专利范围第27项之方法,其中该更新参数包含一先前三讯框平均声音能量参数。32.如申请专利范围第27项之方法,其中该更新参数包含一声音活动侦测参数。33.一种语音分类器,其包含:一产生器,用以产生分类参数;一正常化自动关联系数功能,其可根据一信号环境而用以设定一正常化自动关联系数功能临界値,及选取一参数分析器;及一参数分析器,用以分析至少一外部输入参数及内部参数,以产生一语音模式分类。34.如申请专利范围第33项之语音分类器,其中用以产生分类参数的该产生器可从一杂讯抑制语音语音产生参数。35.如申请专利范围第33项之语音分类器,其中用以产生分类参数的该产生器可从信号到杂讯比资讯产生参数。36.如申请专利范围第33项之语音分类器,其中用以产生分类参数的该产生器可从声音活动资讯产生参数。37.如申请专利范围第33项之语音分类器,其中用以产生分类参数的该产生器可从线性预测反映系数产生参数。38.如申请专利范围第33项之语音分类器,其中用以产生分类参数的该产生器可从正常化自动关联系数功能资讯产生参数。39.如申请专利范围第33项之语音分类器,其中用以产生分类参数的该产生器可在音调资讯上从正常化自动关联系数功能产生参数。40.如申请专利范围第39项之语音分类器,其中在音调资讯上的该正常化自动关联系数功能是一阵列値。41.如申请专利范围第33项之语音分类器,其中该等产生的参数包含一零交错率参数。42.如申请专利范围第33项之语音分类器,其中该等产生的参数包含一目前讯框能量参数。43.如申请专利范围第33项之语音分类器,其中该等产生的参数包含前视讯构能量参数。44.如申请专利范围第33项之语音分类器,其中该等产生的参数包含一频带能量比参数。45.如申请专利范围第33项之语音分类器,其中该等产生的参数包含三讯框平均声音能量参数。46.如申请专利范围第33项之语音分类器,其中该等产生的参数包含一先前三讯框平均声音能量参数。47.如申请专利范围第33项之语音分类器,其中该等产生的参数包含一目前讯框能量与先前三讯框平均声音能量比参数。48.如申请专利范围第33项之语音分类器,其中该等产生的参数包含一目前讯框能量与三讯框平均声音能量比参数。49.如申请专利范围第33项之语音分类器,其中该等产生的参数包含一最大子讯框能量索引参数。50.如申请专利范围第33项之语音分类器,其中该设定一正常化自动关联系数功能临界値包含将一信号杂讯比资讯参数与一预定信号杂讯比値相比较。51.如申请专利范围第33项之语音分类器,其中该分析包含将该等参数应用到一状态机器。52.如申请专利范围第51项之语音分类器,其中该状态机器包含每个语音分类模式的一状态。53.如申请专利范围第33项之语音分类器,其中该语音模式分类包含一暂态模式。54.如申请专利范围第33项之语音分类器,其中该语音模式分类包含一向上暂态模式。55.如申请专利范围第33项之语音分类器,其中该语音模式分类包含一向下暂态模式。56.如申请专利范围第33项之语音分类器,其中该语音模式分类包含一声音模式。57.如申请专利范围第33项之语音分类器,其中该语音模式分类包含一无声音模式。58.如申请专利范围第33项之语音分类器,其中该语音模式分类包含一静音模式。59.如申请专利范围第33项之语音分类器,其进一步包含更新至少一参数。60.如申请专利范围第59项之语音分类器,其中该更新的参数包含在音调参数上的一正常化自动关联系数功能。61.如申请专利范围第59项之语音分类器,其中该更新的参数包含三讯框平均声音能量参数。62.如申请专利范围第59项之语音分类器,其中该更新的参数包含一前视讯构能量参数。63.如申请导利范围第59项之语音分类器,其中该更新的参数包含一先前三讯框平均声音能量参数。64.如申请专利范围第59项之语音分类器,其中该更新的参数包含一声音活动侦测参数。图式简单说明:图1是语音编码器在每端状态结束的一通讯频道方块图;图2是由图1所示的编码器所使用的一健全语音分类器方块图;图3系描述一健全语音分类器的语音分类步骤流程图;图4A、4B、和4C是由揭示的具体实施例所使用有关语音分类的状态图;图5A、5B、和5C是由揭示的具体实施例所使用有关语音分类的决定表;及图6是具分类参数、及语音模式値的一语音信号具体实施例范例图。
地址 美国