发明名称 MDCT域信号能量与相位补偿方法及其装置
摘要 本发明提出了MDCT域信号能量与相位补偿方法及其装置,通过分析MDCT变换基和MDST变换基之间的关系,利用稀疏化近似矩阵,提取并简化MDCT至MDST的转换矩阵;利用转换矩阵实现MDCT谱至MDST谱的转换,并联合两者构造具有恒定能量及线性相位的MDFT谱;依据MDFT谱提取空间参数。本发明有效解决了信号在MDCT域的能量抖动及相位缺失问题,实现了在空间音频编码系统中低复杂度的MDCT域空间参数提取合成。
申请公布号 CN101521012A 申请公布日期 2009.09.02
申请号 CN200910061439.4 申请日期 2009.04.08
申请人 武汉大学 发明人 胡瑞敏;陈水仙;陈冰;陈琪
分类号 G10L19/00(2006.01)I 主分类号 G10L19/00(2006.01)I
代理机构 武汉天力专利事务所 代理人 严 彦;冯卫平
主权项 1.一种MDCT域信号能量与相位补偿方法,其特征在于,包含以下步骤:步骤1,对输入信号进行MDCT变换,获得每一帧信号的MDCT谱X<sup>i</sup>、前一帧MDCT谱X<sup>i-1</sup>,以及后一帧MDCT谱X<sup>i+1</sup>;步骤2,利用步骤1所得的前一帧MDCT谱X<sup>i-1</sup>和后一帧MDCT谱X<sup>i+1</sup>,计算差矩阵系数<img file="A200910061439C0002155019QIETU.GIF" wi="69" he="67" />及矩阵系数<img file="A200910061439C00021.GIF" wi="84" he="48" /><maths num="0001"><![CDATA[<math><mrow><msubsup><mi>X</mi><mo>-</mo><mi>i</mi></msubsup><mo>=</mo><mrow><mo>(</mo><msup><mi>X</mi><mrow><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msup><mo>-</mo><msup><mi>X</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mo>/</mo><mn>2</mn><mo>,</mo></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><msubsup><mi>X</mi><mo>+</mo><mi>i</mi></msubsup><mo>=</mo><mrow><mo>(</mo><msup><mi>X</mi><mrow><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msup><mo>+</mo><msup><mi>X</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mo>/</mo><mn>2</mn><mo>;</mo></mrow></math>]]></maths>利用MDCT和MDST的变换基特性以及相互关系,从MDCT和MDST的矩阵定义式出发,得到MDCT到MDST的转换矩阵,所述转换矩阵包括和矩阵T<sub>+</sub>及差矩阵T<sub>-</sub>,<maths num="0003"><![CDATA[<math><mrow><msub><mi>T</mi><mo>+</mo></msub><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mrow><mo>(</mo><msubsup><mi>S</mi><mn>1</mn><mi>T</mi></msubsup><msub><mi>C</mi><mn>0</mn></msub><mo>+</mo><msubsup><mi>S</mi><mn>0</mn><mi>T</mi></msubsup><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths><maths num="0004"><![CDATA[<math><mrow><msub><mi>T</mi><mo>-</mo></msub><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mrow><mo>(</mo><msubsup><mi>S</mi><mn>1</mn><mi>T</mi></msubsup><msub><mi>C</mi><mn>0</mn></msub><mo>-</mo><msubsup><mi>S</mi><mn>0</mn><mi>T</mi></msubsup><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中C<sub>0</sub>、C<sub>1</sub>分别为MDCT的变换基的前半部分和后半部分的子向量,S<sub>0</sub>、S<sub>1</sub>分别为MDST的变换基的前半部分和后半部分的子向量,MDCT和MDST的变换基为2N×N的矩阵,MDCT和MDST分别的前半部分和后半部分的子向量均为N×N的矩阵;对和矩阵T<sub>+</sub>进行稀疏近似化,得到近似化和矩阵T<sub>m</sub>;步骤3,结合差矩阵系数<img file="A200910061439C0002155019QIETU.GIF" wi="69" he="67" />、和矩阵系数<img file="A200910061439C00026.GIF" wi="87" he="49" />差矩阵T<sub>-</sub>和近似化和矩阵T<sub>m</sub>,合成当前帧的MDST谱Y<sup>i</sup>,<maths num="0005"><![CDATA[<math><mrow><msup><mi>Y</mi><mi>i</mi></msup><mo>=</mo><msub><mi>T</mi><mo>-</mo></msub><msubsup><mi>X</mi><mo>-</mo><mi>i</mi></msubsup><mo>+</mo><msub><mi>T</mi><mi>m</mi></msub><msubsup><mi>X</mi><mo>+</mo><mi>i</mi></msubsup><mo>;</mo></mrow></math>]]></maths>步骤4,由信号的MDCT谱和MDST谱,构造MDFT谱,MDFT谱的构造方式为将MDCT谱作为实部,MDST谱作为虚部,即Z(k)=X(k)-jY(k)其中X(k)为输入信号的MDCT谱,Y(k)为输入信号的MDST谱,Z(k)为输入信号的MDFT谱;j表示虚部;k=0,1,...,N-1;步骤5,利用步骤4所获输入信号的MDFT谱Z(k),在MDCT域上提取能量信息,提取方式为依据如下公式求取信号MDFT谱能量E<sub>m</sub><maths num="0006"><![CDATA[<math><mrow><msub><mi>E</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><msub><mi>E</mi><mi>m</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><msup><mrow><mrow><mo>|</mo><mi>Z</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>|</mo></mrow></mrow><mn>2</mn></msup></mrow></math>]]></maths>其中E<sub>t</sub>表示输入信号的时域信号能量E<sub>t</sub>;利用步骤4所获输入信号的MDFT谱Z(k),在MDCT域上提取相位信息,提取方式为将MDFT谱延时d个采样点,得到线性相位<img file="A200910061439C00032.GIF" wi="46" he="35" />即<maths num="0007"><![CDATA[<math><mrow><mo>&PartialD;</mo><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><mfrac><mi>&pi;</mi><mi>N</mi></mfrac><mi>d</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>其中k=0,1,...,N-1,exp表示指数运算,j表示虚部;步骤6,结合步骤5所提取的能量信息和相位信息,在MDCT域上提取空间参数。2.根据权利要求书1所述的MDCT域能量与相位补偿方法,其特征在于:步骤2中,将MDCT的变换基c<sub>k</sub>和MDST的变换基s<sub>k</sub>分解为N维列向量表示,即<maths num="0008"><![CDATA[<math><mrow><msup><mrow><mo>(</mo><msub><mi>c</mi><mi>k</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mo>=</mo><mrow><mfenced open='(' close=')'><mtable><mtr><mtd><msup><mrow><mo>(</mo><msubsup><mi>c</mi><mi>k</mi><mn>0</mn></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mtd><mtd><msup><mrow><mo>(</mo><msubsup><mi>c</mi><mi>k</mi><mn>1</mn></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mtd></mtr></mtable></mfenced></mrow></mrow></math>]]></maths><maths num="0009"><![CDATA[<math><mrow><msup><mrow><mo>(</mo><msub><mi>s</mi><mi>k</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mo>=</mo><mrow><mfenced open='(' close=')'><mtable><mtr><mtd><msup><mrow><mo>(</mo><msubsup><mi>s</mi><mi>k</mi><mn>0</mn></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mtd><mtd><msup><mrow><mo>(</mo><msubsup><mi>s</mi><mi>k</mi><mn>1</mn></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mtd></mtr></mtable></mfenced></mrow></mrow></math>]]></maths>其中,<maths num="0010"><![CDATA[<math><mrow><msub><mi>c</mi><mi>k</mi></msub><mo>=</mo><mi>cos</mi><mrow><mo>(</mo><mfrac><mi>&pi;</mi><mi>N</mi></mfrac><mrow><mo>(</mo><mi>n</mi><mo>+</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>+</mo><mfrac><mi>N</mi><mn>2</mn></mfrac><mo>)</mo></mrow><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths><maths num="0011"><![CDATA[<math><mrow><msub><mi>s</mi><mi>k</mi></msub><mo>=</mo><mi>sin</mi><mrow><mo>(</mo><mfrac><mi>&pi;</mi><mi>N</mi></mfrac><mrow><mo>(</mo><mi>n</mi><mo>+</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>+</mo><mfrac><mi>N</mi><mn>2</mn></mfrac><mo>)</mo></mrow><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>k=0,1,...,N-1,n=0,1,...,2N-1,上标“T”表示转置,上标“0”和“1”分别用于标识变换基的前半部分和后半部分的子向量;从而得到以下四个N×N矩阵形式的子向量<maths num="0012"><![CDATA[<math><mrow><msub><mi>C</mi><mn>0</mn></msub><mo>=</mo><mrow><mfenced open='(' close=')'><mtable><mtr><mtd><msubsup><mi>c</mi><mn>0</mn><mn>0</mn></msubsup></mtd><mtd><msubsup><mi>c</mi><mn>1</mn><mn>0</mn></msubsup></mtd><mtd><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo></mtd><mtd><msubsup><mi>c</mi><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow><mn>0</mn></msubsup></mtd></mtr></mtable></mfenced></mrow></mrow></math>]]></maths><maths num="0013"><![CDATA[<math><mrow><msub><mi>C</mi><mn>1</mn></msub><mo>=</mo><mrow><mfenced open='(' close=')'><mtable><mtr><mtd><msubsup><mi>c</mi><mn>0</mn><mn>1</mn></msubsup></mtd><mtd><msubsup><mi>c</mi><mn>1</mn><mn>1</mn></msubsup></mtd><mtd><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo></mtd><mtd><msubsup><mi>c</mi><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow><mn>1</mn></msubsup></mtd></mtr></mtable></mfenced></mrow></mrow></math>]]></maths><maths num="0014"><![CDATA[<math><mrow><msub><mi>S</mi><mn>0</mn></msub><mo>=</mo><mrow><mfenced open='(' close=')'><mtable><mtr><mtd><msubsup><mi>S</mi><mn>0</mn><mn>0</mn></msubsup></mtd><mtd><msubsup><mi>S</mi><mn>1</mn><mn>0</mn></msubsup></mtd><mtd><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo></mtd><mtd><msubsup><mi>S</mi><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow><mn>0</mn></msubsup></mtd></mtr></mtable></mfenced></mrow></mrow></math>]]></maths><maths num="0015"><![CDATA[<math><mrow><msub><mi>S</mi><mn>1</mn></msub><mo>=</mo><mrow><mfenced open='(' close=')'><mtable><mtr><mtd><msubsup><mi>S</mi><mn>0</mn><mn>1</mn></msubsup></mtd><mtd><msubsup><mi>S</mi><mn>1</mn><mn>1</mn></msubsup></mtd><mtd><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo></mtd><mtd><msubsup><mi>S</mi><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow><mn>1</mn></msubsup></mtd></mtr></mtable></mfenced></mrow></mrow></math>]]></maths>所述提取MDCT到MDST的转换矩阵,包括和矩阵T<sub>+</sub>和差矩阵T<sub>-</sub>,通过将上述四个子向量带入下列公式求得<maths num="0016"><![CDATA[<math><mrow><msub><mi>T</mi><mo>+</mo></msub><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mrow><mo>(</mo><msubsup><mi>S</mi><mn>1</mn><mi>T</mi></msubsup><msub><mi>C</mi><mn>0</mn></msub><mo>+</mo><msubsup><mi>S</mi><mn>0</mn><mi>T</mi></msubsup><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0017"><![CDATA[<math><mrow><msub><mi>T</mi><mo>-</mo></msub><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mrow><mo>(</mo><msubsup><mi>S</mi><mn>1</mn><mi>T</mi></msubsup><msub><mi>C</mi><mn>0</mn></msub><mo>-</mo><msubsup><mi>S</mi><mn>0</mn><mi>T</mi></msubsup><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>.</mo></mrow></math>]]></maths>
地址 430072湖北省武汉市武昌珞珈山