发明名称 基于预测模式拷贝的HEVC多描述编码
摘要 基于预测模式拷贝的HEVC多描述编码算法,属于信号处理技术领域,特别涉及信号编码技术。用来解决多相空间亚采样多描述视频编码方法产生冗余过多,尤其在中高比特率编码压缩时编码效率不高这一问题。在编码时,对各描述采用了不同方案。其中编码器采用HEVC,只对单个描述的其中一个子序列预测编码,而对于另一子序列的预测模式和运动矢量的选择则直接拷贝已编码子序列的对应块,同时计算预测残差。此方法充分利用各子序列间的时空相关性,在降低冗余性的基础上,减少了编码计算。由于单个描述的两子序列之间有很强的时空相关性,各子序列时间轴位置相同的单个帧的图像块有类似的最佳运动预测模式,且运动矢量基本相似。
申请公布号 CN104219530A 申请公布日期 2014.12.17
申请号 CN201410505535.4 申请日期 2014.09.28
申请人 北京工商大学 发明人 苏维均;邵军;陈秀新;于重重;高成
分类号 H04N19/39(2014.01)I 主分类号 H04N19/39(2014.01)I
代理机构 代理人
主权项 一种基于预测模式拷贝的HEVC多描述编码方法,其特征在于,所述的方法包括以下步骤:(1)对原始待编码的YUV视频以帧为单位进行梅花下采样,采样方向分为水平和竖直,从而产生子序列<img file="FSA0000108671980000011.GIF" wi="436" he="65" />将<img file="FSA0000108671980000012.GIF" wi="61" he="46" />和<img file="FSA0000108671980000013.GIF" wi="65" he="48" />组合成一个描述,将<img file="FSA0000108671980000014.GIF" wi="67" he="54" />和<img file="FSA0000108671980000015.GIF" wi="65" he="52" />组合成一个描述;其中<img file="FSA0000108671980000016.GIF" wi="61" he="46" />和<img file="FSA0000108671980000017.GIF" wi="66" he="48" />是对原始待编码的YUV视频的第k帧进行水平方向采集的子序列,<img file="FSA0000108671980000018.GIF" wi="66" he="54" />和<img file="FSA0000108671980000019.GIF" wi="64" he="51" />是垂直方向采集的子序列;(2)使用HEVC编码器分别编码子序列<img file="FSA00001086719800000110.GIF" wi="60" he="46" />和<img file="FSA00001086719800000111.GIF" wi="89" he="66" />并保存各自预测单元的最佳预测模式和运动矢量;(3)对于<img file="FSA00001086719800000112.GIF" wi="64" he="48" />和<img file="FSA00001086719800000113.GIF" wi="65" he="52" />中的每一预测单元,分别读取<img file="FSA00001086719800000114.GIF" wi="61" he="46" />和<img file="FSA00001086719800000115.GIF" wi="68" he="54" />对应位置(空间位置相同)预测单元的最佳预测模式和运动矢量;计算出对应的预测残差<img file="FSA00001086719800000116.GIF" wi="71" he="48" />和<img file="FSA00001086719800000117.GIF" wi="91" he="63" />其中<img file="FSA00001086719800000118.GIF" wi="72" he="45" />表示<img file="FSA00001086719800000119.GIF" wi="65" he="53" />和<img file="FSA00001086719800000120.GIF" wi="64" he="52" />空间位置对应计算出的预测残差,<img file="FSA00001086719800000121.GIF" wi="64" he="46" />表示<img file="FSA00001086719800000122.GIF" wi="61" he="46" />和<img file="FSA00001086719800000123.GIF" wi="65" he="49" />空间位置对应计算出的预测残差;(4)确定当前的预测单元类型,若是帧内预测(I帧,帧内编码帧)跳至步骤(5),若是帧间预测则跳至步骤(6);(5)如果<img file="FSA00001086719800000124.GIF" wi="59" he="45" />对应位置的预测单元是帧内预测,那么选用该预测单元的最佳帧内预测模式直接对<img file="FSA00001086719800000125.GIF" wi="66" he="48" />的当前预测单元进行帧内预测;同理,对<img file="FSA00001086719800000126.GIF" wi="62" he="51" />的帧内预测要参照<img file="FSA00001086719800000127.GIF" wi="67" he="53" />进行处理;跳至(7);(6)如果<img file="FSA00001086719800000128.GIF" wi="59" he="45" />的对应位置预测单元是帧间预测(P帧,前向预测的帧间编码),那么选用该预测单元的最佳预测模式和运动矢量对<img file="FSA00001086719800000129.GIF" wi="65" he="48" />的当前预测单元进行帧间预测;同理,对<img file="FSA00001086719800000130.GIF" wi="64" he="51" />的帧间预测参照<img file="FSA00001086719800000131.GIF" wi="68" he="53" />进行处理;(7)对<img file="FSA00001086719800000132.GIF" wi="64" he="51" />和<img file="FSA00001086719800000133.GIF" wi="65" he="48" />当前预测单元的预测误差<img file="FSA00001086719800000134.GIF" wi="71" he="48" />和<img file="FSA00001086719800000135.GIF" wi="66" he="46" />进行DCT、量化和熵编码;(8)将<img file="FSA00001086719800000136.GIF" wi="60" he="45" />和<img file="FSA00001086719800000137.GIF" wi="63" he="45" />的熵编码结果、<img file="FSA00001086719800000138.GIF" wi="66" he="54" />和<img file="FSA00001086719800000139.GIF" wi="69" he="45" />的熵编码结果分别打包成两个描述通过不同信道进行传输。
地址 100048 北京市海淀区阜成路33号