发明名称 一种基于Haar小波提升的特征波形分解与重构方法
摘要 本发明涉及一种基于Haar小波提升的特征波形分解与重构方法,属于语音编码领域,主要用于波形内插(WI)语音编码算法。当前分析帧提取的特征波形在进行分解之前,首先将其离散时间傅里叶级数(DTFS)的幅度谱转化为离散余弦变换(DCT)系数,然后用Haar小波变换的提升方案实现特征波的多级分解与重构,对各级分解参数进行不同方式的量化编码,并利用相位谱间距的均值和基音周期增益判断当前帧的浊音度标志,以决定解码端选择固定相位谱或随机相位谱。Haar小波提升方法能够降低特征波形分解与重构过程的运算复杂度和内存空间,且不引入算法延迟,可使波形内插编码算法在较低速率上获得较为满意的合成音质。
申请公布号 CN1920950B 申请公布日期 2010.07.07
申请号 CN200610152641.4 申请日期 2006.09.25
申请人 北京理工大学 发明人 王晶;赵胜辉;匡镜明
分类号 G10L19/00(2006.01)I 主分类号 G10L19/00(2006.01)I
代理机构 北京理工大学专利中心 11120 代理人 张利萍
主权项 1.一种基于Haar小波提升的特征波形分解与重构方法,其特征在于:对特征波形内插语音编码算法中当前帧提取得到的特征波序列进行如下操作:(1)在进行特征波形分解之前,首先对特征波形进行相位对齐和功率归一化,将特征波的离散时间傅里叶级数系数由直角坐标系转化为极坐标系表示的幅度谱和相位谱;(2)对步骤(1)得到的当前帧的特征波相位谱序列首先通过补零的方式变换到相同维数,然后按照下式计算每两个相邻的N维特征波相位谱序列<img file="FA20192043200610152641401C00011.GIF" wi="41" he="56" />和<img file="FA20192043200610152641401C00012.GIF" wi="73" he="55" />之间的距离:<maths num="0001"><![CDATA[<math><mrow><msub><mi>D</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mo>{</mo><msup><mrow><mo>[</mo><mi>cos</mi><mrow><mo>(</mo><msubsup><mover><mi>&theta;</mi><mo>^</mo></mover><mi>j</mi><mi>i</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mi>cos</mi><mrow><mo>(</mo><msubsup><mover><mi>&theta;</mi><mo>^</mo></mover><mi>j</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>)</mo></mrow><mo>]</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>[</mo><mi>sin</mi><mrow><mo>(</mo><msubsup><mover><mi>&theta;</mi><mo>^</mo></mover><mi>j</mi><mi>i</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mi>sin</mi><mrow><mo>(</mo><msubsup><mover><mi>&theta;</mi><mo>^</mo></mover><mi>j</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>)</mo></mrow><mo>]</mo></mrow><mn>2</mn></msup><mo>}</mo><mo>;</mo></mrow></math>]]></maths>其中,i代表第i个特征波提取点,i=1,2,...,I,I为一帧内提取的特征波的个数,j代表离散时间傅里叶级数系数矢量的第j维,P(i)是每个特征波提取点的基音周期,即时域特征波形的长度,符号<img file="FA20192043200610152641401C00014.GIF" wi="58" he="47" />表示向下取整;对所获得的相位谱序列间距求均值,作为步骤(5)中编码端进行浊音度标志判断的参量之一;(3)对特征波的幅度谱序列进行离散余弦矩阵变换,获得相同维数的离散余弦变换系数序列;(4)对步骤(3)获得的离散余弦变换系数序列进行Haar小波提升方案下对应编码端的特征波形分解与对应解码端的特征波形重构;(5)编码端根据当前帧的基音周期增益和步骤(2)获得的相位谱间距的均值二者联合判断浊音度标志,解码端相位谱的恢复通过当前帧的浊音度标志来选择固定或随机相位。
地址 100081 北京市海淀区中关村南大街5号