发明名称 基于过渡帧判决及处理的激励信号自然度提高方法
摘要 基于过渡帧判决及处理的激励信号自然度提高方法属于低速率语音压缩编码技术领域。若当前帧前后各60个样点的平均能量比值小于1/32,则被判定为过渡帧,并用子带清浊音矢量的冗余模式进行表示,解码端对参数进行解量化,根据解码得到的子带清浊音矢量判决当前帧是否为过渡帧,若判定为非过渡帧,再判决当前帧是否为浊音帧且前一帧是否为清音帧,若是,则在合成激励信号时,解码端当前帧参数不与前一帧参数进行插值。这种方法可以提高合成语音的自然度。该方法适用于SELP 2.4kbps声码器。
申请公布号 CN101261836B 申请公布日期 2011.03.30
申请号 CN200810105137.8 申请日期 2008.04.25
申请人 清华大学 发明人 崔慧娟;唐昆;计哲;李晔
分类号 G10L19/14(2006.01)I 主分类号 G10L19/14(2006.01)I
代理机构 代理人
主权项 基于过渡帧判决及处理的激励信号自然度提高方法,其特征在于,所述方法在编、解码端依次按以下步骤实现:在编码端,依次按如下步骤执行:步骤(1)对输入的8khz频率采样的语音信号样点按时间顺序分帧,每帧200个样点;步骤(2)对当前帧提取基音周期参数;步骤(3)对当前帧提取能量参数;步骤(4)对当前帧提取余量谱幅度参数;步骤(5)对当前帧提取5个子带清浊音判决参数,子带清音用“0”表示,子带浊音用“1”表示;步骤(6)求取当前帧前后各60个样点的平均能量,当后60个样点的平均能量大于前60个样点平均能量的32倍时,判定当前帧为过渡帧;步骤(7)若当前帧为过渡帧,并且步骤(5)中求取的子带清浊音判决参数为除10000以外的其他模式,则将第一个子带的清浊音判决参数置为0;步骤(8)将步骤(2)、步骤(3)和步骤(4)求取的特征参数以及步骤(7)修正的清浊音判决参数进行量化,将量化索引传递给解码端;在解码端,依次按如下步骤执行:步骤(1′)解码端根据步骤(8)发送的量化索引进行解量化,得到合成激励信号所需的参数,若清浊音判决参数中第一个子带的清浊音判决参数为0,并且后四个子带的清浊音判决参数不全为0,解码端自动将第一个子带的清浊音判决参数置为1,并判定当前帧为过渡帧;步骤(2′)将步骤(1′)修正的第一个子带的清浊音判决参数作为当前帧的全带清浊音判决参数;步骤(3′)对步骤(1′)中所得到的参数进行插值,若前一帧和当前帧为浊音帧,并且基音周期的变化率小于22.5%,则对解码端所得参数采用逐点的线性插值,如公式(1)所示;若前一帧为清音帧且当前帧为浊音帧,并且当前帧不为过渡帧,则不进行插值,即立刻使用本帧解码得到的参数值;否则采用分段插值,如公式(2)所示;par(k)=parold+(parnew‑parold)·k/(N‑1)    (1) <mrow> <mi>par</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close='' separators=' '> <msub> <mi>par</mi> <mi>old</mi> </msub> <mtable> <mtr> <mtd> <msub> <mi>par</mi> <mi>old</mi> </msub> </mtd> <mtd> <mn>0</mn> <mo>&le;</mo> <mi>k</mi> <mo>&lt;</mo> <mn>75</mn> </mtd> <mtd> </mtd> </mtr> <mtr> <mtd> <mo>[</mo> <mn>1</mn> <mo>-</mo> <mrow> <mo>(</mo> <mi>k</mi> <mo>-</mo> <mn>75</mn> <mo>)</mo> </mrow> <mo>/</mo> <mn>50</mn> <mo>]</mo> <mo>+</mo> <msub> <mi>par</mi> <mi>new</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>-</mo> <mn>75</mn> <mo>)</mo> </mrow> <mo>/</mo> <mn>50</mn> </mtd> <mtd> </mtd> <mtd> <mn>75</mn> <mo>&le;</mo> <mi>k</mi> <mo>&lt;</mo> <mn>125</mn> </mtd> </mtr> <mtr> <mtd> <msub> <mi>par</mi> <mi>new</mi> </msub> </mtd> <mtd> <mn>125</mn> <mo>&le;</mo> <mi>k</mi> <mo>&lt;</mo> <mn>200</mn> </mtd> <mtd> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>其中,N为每帧的合成语音样点,取值200,parold为前一帧的参数,parnew为当前帧的参数,par(k)为插值后的参数,k表示合成语音样点;步骤(4′)根据步骤(3′)中插值后的参数合成激励信号。
地址 100084 北京市100084信箱82分箱清华大学专利办公室