发明名称 1kb/s线谱频率参数的一步插值预测矢量量化方法
摘要 1kb/s线谱频率参数的一步插值预测矢量量化方法,属于语音信号处理,可应用于中低速率语音编码和参数语音合成系统中。本发明矢量量化的工作过程是在计算机处理器中完成,其特征在于,基于矢量量化原理,利用LSF参数的帧间和帧内相关性,在帧内采用一步预测和在帧间采用一步内插的方法设计了一种1kb/s LSF参数的矢量量化器,对通过一步内插预测过程消除冗余度的LSF预测残差矢量进行矢量量化,获得了透明的量化结果,满足了低速率语音编码对声道参数进行透明量化的要求。
申请公布号 CN1420487A 申请公布日期 2003.05.28
申请号 CN02156676.3 申请日期 2002.12.19
申请人 北京工业大学 发明人 鲍长春
分类号 G10L21/00;G10L19/00 主分类号 G10L21/00
代理机构 北京工大思海专利代理有限责任公司 代理人 张慧
主权项 1、1kb/s线谱频率参数的一步插值预测矢量量化方法,包含在计算机处理器中完成对语音信号的线谱频率参数(LSF)进行量化,本发明的特征在于基于矢量量化原理,利用LSF参数的帧间和帧内相关性,在帧内采用一步预测和在帧间采用一步内插的方法设计了一种1kb/s LSF参数的矢量量化器,对通过一步内插预测过程消除冗余度的LSF预测残差矢量r<sup>(n)</sup>进行矢量量化,矢量量化的工作流程如下:编码过程:首先,将第n帧量化的第i-1个线谱频率<img file="A0215667600021.GIF" wi="77" he="59" />与第n-1帧量化的第i个线谱频率<img file="A0215667600022.GIF" wi="104" he="60" />的加权和作为第n帧的第i个线谱频率的预测值<img file="A0215667600023.GIF" wi="78" he="58" />,即<maths num="001"><![CDATA[ <math><mrow><msubsup><mover><mi>&omega;</mi><mo>~</mo></mover><mi>i</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></msubsup><mo>=</mo><msub><mi>&alpha;</mi><mi>i</mi></msub><msubsup><mover><mi>&omega;</mi><mo>^</mo></mover><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></msubsup><mo>+</mo><msub><mi>&beta;</mi><mi>i</mi></msub><msubsup><mover><mi>&omega;</mi><mo>^</mo></mover><mi>i</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>p</mi></mrow></math>]]></maths>式中α<sub>i</sub>和β<sub>i</sub>称为权系数,又称α<sub>i</sub>和β<sub>i</sub>为帧内预测系数和帧间内插系数;一步内插预测过程是指仅考虑第n帧与第n-1帧的LSF相关性以及第n帧的第i个LSF和第i-1个LSF的相关性的加权求和过程;一步内插是指将第n-1帧量化的第i个线谱频率<img file="A0215667600025.GIF" wi="105" he="57" />乘以权系数β<sub>i</sub>;一步预测是指将第n帧量化的第i-1个线谱频率<img file="A0215667600026.GIF" wi="77" he="59" />乘以权系数α<sub>i</sub>;根据最小二乘原理,权系数α<sub>i</sub>和β<sub>i</sub>可以从LSF的训练序列中计算出来,并在量化器中保持为常数;第二,将输入量化器的无偏线谱频率ω<sub>i</sub><sup>(n)</sup>与其预测值<img file="A0215667600027.GIF" wi="78" he="57" />相减,得到LSF残差矢量r<sup>(n)</sup>;第三,将预测误差矢量r<sup>(n)</sup>分裂成两个子矢量,令前四个分量构成一个子矢量,后六个分量构成一个子矢量,这两个子矢量分别与两个10bit码书中的码矢量进行Paliwal加权失真比较,得到两个重构的残差子矢量<img file="A0215667600031.GIF" wi="190" he="57" />i=1,…,4和<img file="A0215667600032.GIF" wi="191" he="57" />i=5,…,10;这里k<sub>1</sub><sup>(n)</sup>和k<sub>2</sub><sup>(n)</sup>分别表示进入信道的两个残差码书的码矢量标号,将这两个重构的残差子矢量合并,得到重建的残差矢量<img file="A0215667600033.GIF" wi="87" he="50" />第四,将重构的残差矢量<img file="A0215667600034.GIF" wi="63" he="46" />加上预测矢量<img file="A0215667600035.GIF" wi="76" he="46" />得到LSF的无偏重构矢量<img file="A0215667600036.GIF" wi="76" he="45" />,该重构矢量<img file="A0215667600037.GIF" wi="76" he="45" />将用于下一帧的一步内插预测过程;译码过程:首先,译码端根据收到的标号k<sub>1</sub><sup>(n)</sup>和k<sub>2</sub><sup>(n)</sup>,通过查表从两个码书中找到对应的重构残差子矢量<img file="A0215667600038.GIF" wi="191" he="57" />i=1,…,4和<img file="A0215667600039.GIF" wi="189" he="57" />i=5,…,10,将这两个重构的残差子矢量合并,得到重建的残差矢量<img file="A02156676000310.GIF" wi="87" he="50" />第二,用一步内插预测过程得到LSF的预测矢量<img file="A02156676000311.GIF" wi="100" he="49" />第三,将<img file="A02156676000312.GIF" wi="64" he="45" />加上预测矢量<img file="A02156676000313.GIF" wi="76" he="46" />得到LSF的无偏重构矢量<img file="A02156676000314.GIF" wi="99" he="49" />第四,将<img file="A02156676000315.GIF" wi="77" he="45" />加上LSF的均值,得到最终恢复的LSF参数。
地址 100022北京市朝阳区平乐园100号