主权项 |
1.一种基于Haar小波提升的特征波形分解与重构方法,其特征在于:对特征波形内插语音编码算法中当前帧提取得到的特征波序列进行如下操作:(1)在进行特征波形分解之前,首先对特征波形进行相位对齐和功率归一化,将特征波的离散时间傅里叶级数系数由直角坐标系转化为极坐标系表示的幅度谱和相位谱;(2)对步骤(1)得到的当前帧的特征波相位谱序列首先通过补零的方式变换到相同维数,然后按照下式计算每两个相邻的N维特征波相位谱序列<img file="FA20192043200610152641401C00011.GIF" wi="41" he="56" />和<img file="FA20192043200610152641401C00012.GIF" wi="73" he="55" />之间的距离:<maths num="0001"><![CDATA[<math><mrow><msub><mi>D</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mo>{</mo><msup><mrow><mo>[</mo><mi>cos</mi><mrow><mo>(</mo><msubsup><mover><mi>θ</mi><mo>^</mo></mover><mi>j</mi><mi>i</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mi>cos</mi><mrow><mo>(</mo><msubsup><mover><mi>θ</mi><mo>^</mo></mover><mi>j</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>)</mo></mrow><mo>]</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>[</mo><mi>sin</mi><mrow><mo>(</mo><msubsup><mover><mi>θ</mi><mo>^</mo></mover><mi>j</mi><mi>i</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mi>sin</mi><mrow><mo>(</mo><msubsup><mover><mi>θ</mi><mo>^</mo></mover><mi>j</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>)</mo></mrow><mo>]</mo></mrow><mn>2</mn></msup><mo>}</mo><mo>;</mo></mrow></math>]]></maths>其中,i代表第i个特征波提取点,i=1,2,...,I,I为一帧内提取的特征波的个数,j代表离散时间傅里叶级数系数矢量的第j维,P(i)是每个特征波提取点的基音周期,即时域特征波形的长度,符号<img file="FA20192043200610152641401C00014.GIF" wi="58" he="47" />表示向下取整;对所获得的相位谱序列间距求均值,作为步骤(5)中编码端进行浊音度标志判断的参量之一;(3)对特征波的幅度谱序列进行离散余弦矩阵变换,获得相同维数的离散余弦变换系数序列;(4)对步骤(3)获得的离散余弦变换系数序列进行Haar小波提升方案下对应编码端的特征波形分解与对应解码端的特征波形重构;(5)编码端根据当前帧的基音周期增益和步骤(2)获得的相位谱间距的均值二者联合判断浊音度标志,解码端相位谱的恢复通过当前帧的浊音度标志来选择固定或随机相位。 |