发明名称 基于小波域残差的分布式视频编解码方法
摘要 本发明提供了一种基于小波域残差的分布式视频编解码方法。在编码端由帧间预测器获得当前帧F(t)的预测帧F’(t)。然后将F(t)与F’(t)经小波变换后,将各频带分别作差,得到残差信息Res。再对Res进行量化,比特面提取,信道编码。在解码端主要过程包括获取F(t)第n层的初始运动矢量MV<sub>n</sub>,对参考帧F’(t-1)第n层的其余频带分别进行运动补偿,获得F(t)第n层的频带边信息,再将边信息与F’(t)第n层其余频带分别作差,第n层的残差边信息,经过信道译码,残差重建后,将F(t)第n层的残差信息与F’(t)的第n层的频带相加,得到F(t)第n层频带信息。最后将F(t)第n层的4个频带进行小波逆变换,获得第n-1层的最低频带LL<sub>n-1</sub>(t),再进行n-1层译码,直到输出当前帧。
申请公布号 CN105611301A 申请公布日期 2016.05.25
申请号 CN201510982079.7 申请日期 2015.12.23
申请人 四川大学 发明人 卿粼波;徐胤颢;何小海;吴晓红;熊文诗;荣松
分类号 H04N19/61(2014.01)I;H04N19/587(2014.01)I;H04N19/51(2014.01)I;H04N19/30(2014.01)I 主分类号 H04N19/61(2014.01)I
代理机构 代理人
主权项 基于小波域残差的分布式视频编解码方法,其特征在于主要包括以下步骤:1)在编码端,将视频序列按一定的长度,分组为多个图像组GOP,其编码过程如下:(1)在编码端,获取关键帧,将GOP内的关键帧K先进行传统的帧内编码,再进行传统帧内解码;(2)在编码端,获取当前帧F(t)的预测帧F’(t),将相邻两个GOP的关键帧分别作为前项关键帧K_f和后项关键帧K_l,再分别输入到预测器中,对当前帧进行预测,得到当前帧的预测帧F’(t);(3)在编码端,获取当前帧F(t)的残差信息Res,将当前帧F(t)与预测帧F’(t)进行n层9/7小波变换后,并将当前帧F(t)各层各频带分别与预测帧F’(t)的各层各频带分别作差,得到残差信息Res;(4)对残差信息Res进行量化,对量化后的残差信息进行比特面提取,再采用信道码LDPCA对各个比特面进行信道编码;2)在解码端,视频序列解码重建的过程如下:(1)更新前项关键帧K_f与后项关键帧K_l,将关键帧K进行传统的帧内解码,再将相邻两个GOP的关键帧分别作为前项关键帧K_f和后项关键帧K_l。(2)获取当前帧F(t)的预测帧F’(t),将K_f和K_l分别输入到预测器中,对当前帧进行预测,得到当前帧的预测帧F’(t);(3)先获取当前帧F(t)的第n层频带<img file="FDA0000887891620000011.GIF" wi="145" he="79" />残差边信息,再获取当前帧F(t)的第n层频带<img file="FDA0000887891620000012.GIF" wi="165" he="84" />a)更新当前帧F(t)第n层频带<img file="FDA0000887891620000013.GIF" wi="143" he="79" />的频带边信息,直接将参考帧<img file="FDA0000887891620000014.GIF" wi="151" he="78" />的最低频带<img file="FDA0000887891620000015.GIF" wi="230" he="78" />作为当前帧F(t)的第n层频带<img file="FDA0000887891620000016.GIF" wi="142" he="79" />的频带边信息即<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>S</mi><mi>I</mi><mo>_</mo><msub><mi>LL</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mover><mi>L</mi><mo>^</mo></mover><msub><mi>L</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000887891620000017.GIF" wi="525" he="78" /></maths>b)更新当前帧F(t)第n层频带<img file="FDA0000887891620000018.GIF" wi="142" he="79" />的残差边信息,将步骤a)中频带<img file="FDA0000887891620000019.GIF" wi="134" he="85" />的频带边信息SI_LL<sub>n</sub>(t)与当前帧的预测帧F’(t)的第n层的频带LL′<sub>n</sub>(t)作差即SI_Res<sub>n</sub>(t)=SI_LL<sub>n</sub>(t)‑LL′<sub>n</sub>(t),得到当前帧第n层的频带<img file="FDA00008878916200000110.GIF" wi="141" he="77" />的残差边信息SI_Res<sub>n</sub>(t);c)更新当前帧F(t)第n层频带<img file="FDA0000887891620000021.GIF" wi="135" he="79" />的残差信息,将步骤b)中第n层最低频带<img file="FDA0000887891620000022.GIF" wi="140" he="86" />的残差边信息SI_Res<sub>n</sub>(t)进行信道译码,残差重建,得到当前帧第n层最低频带<img file="FDA0000887891620000023.GIF" wi="150" he="85" />的残差信息Res<sub>n</sub>(t);d)获取当前帧F(t)第n层频带<img file="FDA0000887891620000024.GIF" wi="141" he="78" />的重建信息,将步骤c)中得到的当前帧第n层最低频带<img file="FDA0000887891620000025.GIF" wi="132" he="78" />的残差信息Res<sub>n</sub>(t)与预测帧F’(t)第n层的最低频带LL′<sub>n</sub>(t)相加,得到当前帧第n层最低频带<img file="FDA0000887891620000026.GIF" wi="159" he="86" />(4)获取当前帧F(t)的第n层频带<img file="FDA0000887891620000027.GIF" wi="133" he="77" />的初始运动矢量MV<sub>0</sub>,当前帧第n层最低频带<img file="FDA0000887891620000028.GIF" wi="135" he="79" />与参考帧第n层最低频带<img file="FDA0000887891620000029.GIF" wi="238" he="78" />做运动估计,得到初始运动矢量MV<sub>0</sub>;(5)更新当前帧F(t)第n层频带<img file="FDA00008878916200000210.GIF" wi="516" he="84" />的频带边信息,将步骤(4)中获取的初始运动矢量MV<sub>0</sub>,分别对参考帧第n层频带<img file="FDA00008878916200000211.GIF" wi="773" he="87" />做运动补偿,得到当前帧第n层频带<img file="FDA00008878916200000212.GIF" wi="526" he="80" />的各自的频带边信息SI_LH<sub>n</sub>(t),SI_HL<sub>n</sub>(t)和SI_HH<sub>n</sub>(t);(6)更新当前帧F(t)第n层频带<img file="FDA00008878916200000213.GIF" wi="511" he="87" />的残差边信息,将步骤(5)中得到当前帧第n层频带<img file="FDA00008878916200000214.GIF" wi="523" he="87" />的各自的频带边信息SI_LH<sub>n</sub>(t),SI_HL<sub>n</sub>(t)和SI_HH<sub>n</sub>(t)与当前帧的预测帧F’(t)的第n层频带LH′<sub>n</sub>(t),HL′<sub>n</sub>(t),HH′<sub>n</sub>(t),作差,得到与当前帧第n层频带<img file="FDA00008878916200000215.GIF" wi="526" he="78" />的相对应的残差边信息SI_Res<sub>n</sub>(t);(7)更新当前帧F(t)第n层频带<img file="FDA00008878916200000216.GIF" wi="515" he="86" />的残差信息,将步骤(6)中得到当前帧第n层频带<img file="FDA00008878916200000217.GIF" wi="509" he="86" />的残差边信息分别进行信道译码,再进行残差重建,得到当前帧第n层频带<img file="FDA00008878916200000218.GIF" wi="516" he="79" />的相对应的残差信息<img file="FDA00008878916200000219.GIF" wi="191" he="78" />(8)获取当前帧F(t)第n层频带<img file="FDA00008878916200000220.GIF" wi="517" he="86" />的重建信息,将步骤(7)中当前帧第n层频带<img file="FDA00008878916200000221.GIF" wi="485" he="85" />的相对应残差信息<img file="FDA00008878916200000222.GIF" wi="190" he="79" />分别当前帧的预测帧F’(t)的第n层频带LH′<sub>n</sub>(t),HL′<sub>n</sub>(t),HH′<sub>n</sub>(t)相加,得到当前帧第n层频带信息<img file="FDA00008878916200000223.GIF" wi="502" he="87" />(9)将得到的当前帧F(t)第n层频带<img file="FDA00008878916200000224.GIF" wi="731" he="78" />进行9/7小波逆变换,得到当前帧第n‑1层频带<img file="FDA0000887891620000031.GIF" wi="190" he="79" />(10)设置n=n‑1,判断n是否为0,是输出当前帧,否跳转到解码端步骤(4)步进行上一层的解码;(11)判断是否属于下一个GOP,是跳转到步骤(1),否跳转到步骤(2)。
地址 610064 四川省成都市武侯区望江路29号