发明名称 视频编码的整数变换方法
摘要 本发明属于图象处理技术,特别涉及视频编解码器中图像数据压缩的整数变换,针对当前我国将要制定的第一个音视频编码标准(AVS)采用8乘8整数类DCT变换,提出了一种整数变换的变换基选择方法,综合评价变换基的去相关效率和能量集中率两项指标及变换基变换动态范围和计算复杂度,并通过此方法提出两组性能优异的8乘8整数变换基(5,6,4,1)和(4,5,3,1),并得到基于这两组基的整数变换快速算法。
申请公布号 CN100433837C 申请公布日期 2008.11.12
申请号 CN200410012857.1 申请日期 2004.03.18
申请人 华中科技大学 发明人 朱光喜;田晓华;王曜;刘文予;喻莉
分类号 H04N7/30(2006.01);G06F17/14(2006.01) 主分类号 H04N7/30(2006.01)
代理机构 华中科技大学专利中心 代理人 方放
主权项 1.一种视频编码的整数变换方法,在编码端,通过帧内预测或帧间预测,得到块的预测残差并作块变换,将能量集中到少数几个系数中;再通过量化、扫描、游程编码和熵编码,将图像数据压缩并写入编码码流;在解码端则从码流中提取出熵编码的块变换系数,通过反量化和反变换,恢复出块的预测残差,结合预测信息,恢复出块的视频数据;其特征在于:(1)视频编码中8乘8整数变换采用的变换矩阵P由如下步骤得到:(1.1)首先搜索在一定范围内满足正交条件的所有整数变换基,对于8乘8整数变换矩阵P,定义变换基为(k1,k2,k3,k4),<math><mrow><mi>P</mi><mo>=</mo><mfenced open='(' close=')'><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>1</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mi>k</mi><mn>3</mn></mtd><mtd><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>3</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd></mtr><mtr><mtd><mn>2</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>2</mn></mtd><mtd><mo>-</mo><mn>2</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>2</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>3</mn></mtd><mtd><mi>k</mi><mn>3</mn></mtd><mtd><mi>k</mi><mn>1</mn></mtd><mtd><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>2</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>3</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd><mtd><mi>k</mi><mn>4</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>4</mn></mtd><mtd><mi>k</mi><mn>1</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>3</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>2</mn></mtd><mtd><mn>2</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>2</mn></mtd><mtd><mo>-</mo><mn>2</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>3</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd><mtd><mi>k</mi><mn>1</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>2</mn></mtd><mtd><mi>k</mi><mn>3</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>4</mn></mtd></mtr></mtable></mfenced></mrow>得到所有满足P·PT=Diag的整数正交变换基,其中Diag为对角阵;(1.2)建立输入图像残差数据在互相关系数ρ取0.75、0.8、0.85、0.9、0.95时的协方差矩阵COV(Xv),设长度为8的图像残差数据一维向量为XV=[x1,x2,...x8],由一阶马尔科夫模型建立XV元素的协方差矩阵COV(Xv),COV(Xv)(i,j)=ρ|i-j|(0≤i,j≤7),其中ρ为XV相邻元素的互相关系数,ρ≤1;(1.3)通过变换基对应的变换矩阵P,得到变换域的协方差矩阵COV(Yv),变换基(k1,k2,k3,k4)对应的变换矩阵P,归一化,即P每一行元素除以该行向量的长度,得到正交矩阵Pu,对XV作正交变换YV=PuXV,YV的协方差矩阵为:<math><mrow><mi>COV</mi><mrow><mo>(</mo><msub><mi>Y</mi><mi>v</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>P</mi><mi>u</mi></msub><mo>&CenterDot;</mo><mi>COV</mi><mrow><mo>(</mo><msub><mi>X</mi><mi>v</mi></msub><mo>)</mo></mrow><mo>&CenterDot;</mo><msubsup><mi>P</mi><mi>u</mi><mi>T</mi></msubsup></mrow>0.95时的能量集中率ηE值和去相关效率ηC值,定义能量集中率ηE为:<math><mrow><msub><mi>&eta;</mi><mi>E</mi></msub><mo>=</mo><mfrac><mn>1</mn><mroot><mrow><munderover><mi>&Pi;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>8</mn></munderover><mi>COV</mi><msub><mrow><mo>(</mo><msub><mi>Y</mi><mi>v</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow></msub></mrow><mn>8</mn></mroot></mfrac></mrow><math><mrow><msub><mi>&eta;</mi><mi>c</mi></msub><mo>=</mo><mn>1</mn><mo>-</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mrow><mi>j</mi><mo>&NotEqual;</mo><mi>k</mi></mrow></munder><mo>|</mo><mi>COV</mi><msub><mrow><mo>(</mo><msub><mi>Y</mi><mi>v</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow></msub><mo>|</mo></mrow><mrow><munder><mi>&Sigma;</mi><mrow><mi>j</mi><mo>&NotEqual;</mo><mi>k</mi></mrow></munder><mo>|</mo><msub><mrow><mi>COV</mi><mrow><mo>(</mo><msub><mi>X</mi><mi>v</mi></msub><mo>)</mo></mrow></mrow><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow></msub><mo>|</mo></mrow></mfrac></mrow>效率ηC归一化的结果,同一个ρ下,第i个变换基能量集中率ηE的归一化结果为:<math><mrow><msub><mi>Eval</mi><mrow><mi>E</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></msub><mo>=</mo><mfrac><mrow><msub><mi>&eta;</mi><mrow><mi>E</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></msub><mo>-</mo><mi>Min</mi><mrow><mo>(</mo><msub><mi>&eta;</mi><mrow><mi>E</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mrow></msub><mo>)</mo></mrow></mrow><mrow><mi>Max</mi><mrow><mo>(</mo><msub><mi>&eta;</mi><mrow><mi>E</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mrow></msub><mo>)</mo></mrow><mo>-</mo><mi>Min</mi><mrow><mo>(</mo><msub><mi>&eta;</mi><mrow><mi>E</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mrow></msub><mo>)</mo></mrow></mrow></mfrac></mrow><math><mrow><msub><mi>Eval</mi><mrow><mi>c</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></msub><mo>=</mo><mfrac><mrow><msub><mi>&eta;</mi><mrow><mi>c</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></msub><mo>-</mo><mi>Min</mi><mrow><mo>(</mo><msub><mi>&eta;</mi><mrow><mi>c</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mrow></msub><mo>)</mo></mrow></mrow><mrow><mi>Max</mi><mrow><mo>(</mo><msub><mi>&eta;</mi><mrow><mi>c</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mrow></msub><mo>)</mo></mrow><mo>-</mo><mi>Min</mi><mrow><mo>(</mo><msub><mi>&eta;</mi><mrow><mi>c</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mrow></msub><mo>)</mo></mrow></mrow></mfrac></mrow>去相关效率ηC综合的评价结果EvalE、、、EvalC,5点ρ对应的权重分别为1/15、2/15、3/15、4/15、5/15;(1.7)通过对EvalC和EvalE这两项指标加权求和,得到变换基性能的综合评价值Eval,EvakC和EvalE对应的权重分别为0.4、0.6;(1.8)根据所述综合评价值选择变换基,从而获得所述整数变换矩阵;(2)正变换,对8乘8的图像残差数据块做整数变换,形如Y=PXPT,变换的基本单元是形如y=Px的8点一维变换,其中x=[x0,x1,x2,x3,x4,x5,x6,x7]T,输出的y=[y0,y1,y2,y3,y4,y5,y6,y7]T,计算过程如下:(2.1)a0=x0-x7,a1=x1-x6,a2=x2-x5,a3=x3-x4,a4=x0+x7,a5=x1+x6,a6=x2+x5,a7=x3+x4;(2.2)b0=a4+a7,b1=a5+a6,b2=a4-a7,b3=a5-a6;(2.3)y0=b0+b1,y4=b0-b1,y2=b2<<1+b3,y6=b2-b3<<1;(2.4)再完成相当计算下式的计算步骤:<math><mrow><mfenced open='(' close=')'><mtable><mtr><mtd><mi>y</mi><mn>1</mn></mtd></mtr><mtr><mtd><mi>y</mi><mn>3</mn></mtd></mtr><mtr><mtd><mi>y</mi><mn>5</mn></mtd></mtr><mtr><mtd><mi>y</mi><mn>7</mn></mtd></mtr></mtable></mfenced><mo>=</mo><mfenced open='(' close=')'><mtable><mtr><mtd><mi>k</mi><mn>1</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mi>k</mi><mn>3</mn></mtd><mtd><mi>k</mi><mn>4</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>3</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>3</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd><mtd><mi>k</mi><mn>4</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>3</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd></mtr></mtable></mfenced><mfenced open='(' close=')'><mtable><mtr><mtd><mi>a</mi><mn>0</mn></mtd></mtr><mtr><mtd><mi>a</mi><mn>1</mn></mtd></mtr><mtr><mtd><mi>a</mi><mn>2</mn></mtd></mtr><mtr><mtd><mi>a</mi><mn>3</mn></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>令一维变换基本单元为x=PTy,其中y=[y0,y1,y2,y3,y4,y5,y6,y7]T,x=[x0,x1,x2,x3,x4,x5,x6,x7]T.一维反变换为:(3.1)m0=y0+y4;m1=y0-y4;m2=y2<<1+y6;m3=y2-y6<<1;(3.2)b0=m0+m2;b1=m1+m3;b2=m1-m3;b3=m0-m2;(3.3)计算下式的4乘4矩阵乘法:<math><mrow><mfenced open='(' close=')'><mtable><mtr><mtd><mi>a</mi><mn>0</mn></mtd></mtr><mtr><mtd><mi>a</mi><mn>1</mn></mtd></mtr><mtr><mtd><mi>a</mi><mn>2</mn></mtd></mtr><mtr><mtd><mi>a</mi><mn>3</mn></mtd></mtr></mtable></mfenced><mo>=</mo><mfenced open='(' close=')'><mtable><mtr><mtd><mi>k</mi><mn>1</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mi>k</mi><mn>3</mn></mtd><mtd><mi>k</mi><mn>4</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>3</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>3</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd><mtd><mi>k</mi><mn>4</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd></mtr><mtr><mtd><mi>k</mi><mn>4</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>3</mn></mtd><mtd><mi>k</mi><mn>2</mn></mtd><mtd><mo>-</mo><mi>k</mi><mn>1</mn></mtd></mtr></mtable></mfenced><mfenced open='(' close=')'><mtable><mtr><mtd><mi>y</mi><mn>1</mn></mtd></mtr><mtr><mtd><mi>y</mi><mn>3</mn></mtd></mtr><mtr><mtd><mi>y</mi><mn>5</mn></mtd></mtr><mtr><mtd><mi>y</mi><mn>7</mn></mtd></mtr></mtable></mfenced></mrow>(3.4)x0=a0+b0;x1=a1+b1;x2=a2+b2;x3=a3+b3;x7=-a0+b0;x6=-a1+b1;x5=-a2+b2;x4=-a3+b3;其中“<<”表示向左位移运算,其优先级高于加减法。
地址 430074湖北省武汉市洪山区珞喻路1037号