发明名称 用以侦测语音讯号中之声音活动之方法及设备
摘要 一种用于在一个语音通信系统中之语音编码器,对于一个具有有效语音和非有效语音之周期的输入语音讯号产生帧语音判断之方法和设备。一组预设的参数系由输入语音讯号中被提取,其包括一个音调增益和一个音调延迟。根据被提取之参数而计算出之值,对于每一个输入语音讯号之帧产生一个帧语音判断。该组预设的参数更包括一个帧全频带能量,和一组被称为线性频谱频率(LSF)之频谱参数。
申请公布号 TW442774 申请公布日期 2001.06.23
申请号 TW088115784 申请日期 1999.09.14
申请人 寇纳桑系统公司 发明人 雅狄尔班亚辛;艾尔施洛莫特
分类号 G10L9/00 主分类号 G10L9/00
代理机构 代理人 林镒珠 台北市长安东路二段一一二号九楼
主权项 1.一种用以在一语音通信系统中产生帧语音判断的方法,其系包括步骤有:(a)提取一组预设的参数,其包括从每一个帧的输入语音讯号中提取得一个音调增益和一个音调延迟;并且(b)根据所提取的预设参数组来产生一个帧语音判断。2.如申请专利范围第1项所述之方法,其中该组预设的参数系包括一个全频带能量和线性频谱频率(LSF)。3.如申请专利范围第2项所述之方法,其中该产生一个语音判断的步骤系更包括:i计算该音调延迟的标准偏差;ii计算音调增益之长期间平均値;iii计算能量E,ES之短期间平均値;iv计算LSFS之短周期平均値;v计算平均能量E;和vi计算一个平均LSF値,LSFN。4.如申请专利范围第3项所述之方法,其中该产生一个帧语音判断之步骤系更包括步骤有:i)使用一种正规化的Itakura-Saito量测方法来计算一个频谱差异SD1;ii)使用一种平均平方纠错方法来计算一个频谱差异SD2;iii)使用一个平均平方纠错方法来计算一个频谱差异SD3;和计算SD2之长期间平均値。5.如申请专利范围第4项所述之方法,其中一个初始的帧语音判断系依据计算値来进行的。6.如申请专利范围第5项所述之方法,其中该初始的帧语音判断系被平滑。7.如申请专利范围第6项所述之方法,其中一初始化程序系被执行一个预设数目的初始化帧,以至于该语音判断被设定为有效的语音。8.一种用以在一个输入的语音讯号帧上产生一个语音判断的语音有效性侦测器(VAD),该VAD系包括:一个用以从每一个帧之输入的语音讯号提取一组预设的参数之提取器,该些参数系包括一个音调增益和一个音调延迟;一个用以根据该组提取之预设的参数来计算一组预设的値之计算单元;以及一个用以根据该组预设的値来做出一个帧语音判断的判断单元。9.如申请专利范围第8项所述之VAD,其中该组的预设参数进一步包括一个全波段能量和线性频谱频率(LSF)。10.如申请专利范围第9项所述之VAD,其中该计算单元系计算:一个该音调延迟的标准偏差;一个音调增益之长期间平均値;一个能量E,ES之短期间平均値;一个LSFS之短期间平均値;一个平均能量E;和一个平均LSF値,LSFN。11.如申请专利范围第10项所述之VAD,其中该计算单元进一步计算:使用一个正规化的Itakura-Saito量测方法计算一个频谱差异SD1;使用一个平均平方纠错方法计算一个频谱差异SD2;使用一个平均平方纠错方法计算一个频谱差异SD3;和一个SD2之长期间平均値。12.如申请专利范围第11项所述之VAD,其中该判断单元系根据由该计算机构所计算出的値来产生一个初始的帧语音判断。13.如申请专利范围第12项所述之VAD,其中该初始的帧语音判断系被平滑化。14.一种用以在一个输入语音讯号帧内探测语音有效性之语音有效性侦测方法,其改进系包括根据该语音讯号帧之一个音调增益和一个音调延迟来产生语音判断。15.如申请专利范围第14项所述之语音有效性侦测方法,其更包括根据一个帧全频带能量和一组被称为线性频谱频率(LSF)之频谱参数来产生语音判断。图式简单说明:第一图是一个代表使用VAD的语音通信系统的方块图示。第二图(A)和第二图(B)是说明根据本发明之VAD操作的处理流程图。第三图是说明根据本发明之VAD的一个实施例的方块图。
地址 美国