发明名称 一种HEVC帧内预测模式快速选择方法
摘要 本发明涉及一种HEVC帧内预测模式快速选择方法,包括以下步骤:(1)输入一个待估计PU,建立实际可用的帧内预测模式集合;(2)计算待估计PU中的所有像素与其不同方向空间相邻像素的差绝对值和;(3)根据不同方向空间相邻像素的差值绝对值和判断待估计PU的纹理方向特性;(4)根据纹理方向特性确定粗级模式搜索范围;(5)根据粗级模式搜索范围和实际可用的帧内预测模式集合建立率失真优化候选模式集合;(6)选取最佳帧内预测模式。本发明根据待估计PU的纹理方向特征先减少预测模式的粗级搜索范围,再减少进行率失真优化的候选模式个数,可以在保持良好编码率失真性能的同时显著降低HEVC帧内预测模式选择的计算复杂度。
申请公布号 CN105208387A 申请公布日期 2015.12.30
申请号 CN201510675511.8 申请日期 2015.10.16
申请人 浙江工业大学 发明人 朱威;张训华;沈吉龙;杨洋;陈朋;郑雅羽
分类号 H04N19/11(2014.01)I;H04N19/147(2014.01)I 主分类号 H04N19/11(2014.01)I
代理机构 杭州赛科专利代理事务所(普通合伙) 33230 代理人 杨文华
主权项 一种HEVC帧内预测模式快速选择方法,其特征在于,所述的选择方法包括以下步骤:(1)输入一个待估计PU,建立实际可用的帧内预测模式集合:根据待估计PU已存在空间相邻的重建像素和每个HEVC帧内预测模式需要的空间相邻重建像素,为待估计PU选取所有实际可用的帧内预测模式,组成集合Ω;(2)计算待估计PU中的所有像素与其不同方向的空间相邻像素的差值绝对值和:当Ω中存在编号为18的角度预测模式,即待估计PU可以采用沿对角线往右下方向进行预测的角度预测模式,则计算待估计PU中所有像素与其左上方相邻像素的差值绝对值和SAD<sub>LU</sub>,如式(1)所示:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>SAD</mi><mrow><mi>L</mi><mi>U</mi></mrow></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>x</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><munderover><mo>&Sigma;</mo><mrow><mi>y</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>-</mo><mn>1</mn><mo>,</mo><mi>y</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>|</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000823345610000011.GIF" wi="1433" he="167" /></maths>式(1)中,待估计PU的尺寸为N×N(N=4,8,16,32,64),p(x,y)为待估计PU中坐标为(x,y)的像素的像素值,其中x为水平坐标,y为竖直坐标,在待估计PU中它们的值为大于等于0且小于N的整数,坐标为(x‑1,y‑1)的像素位于坐标为(x,y)的左上方;当Ω中存在编号为26的角度预测模式,即待估计PU可以采用竖直向下方向进行预测的角度预测模式,则计算待估计PU中所有像素与其上方相邻像素的差值绝对值和SAD<sub>U</sub>,如式(2)所示:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>SAD</mi><mi>U</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>x</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><munderover><mo>&Sigma;</mo><mrow><mi>y</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>|</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000823345610000012.GIF" wi="1337" he="172" /></maths>式(2)中,待估计PU的尺寸为N×N(N=4,8,16,32,64),p(x,y)为待估计PU中坐标为(x,y)的像素的像素值,其中x为水平坐标,y为竖直坐标,在待估计PU中它们的值为大于等于0且小于N的整数,坐标为(x,y‑1)的像素位于坐标为(x,y)的正上方;当Ω中存在编号为34的角度预测模式,即待估计PU可以采用沿对角线左下方向进行预测的角度预测模式,则计算待估计PU中所有像素与其右上方相邻像素的差值绝对值和SAD<sub>RU</sub>,如式(3)所示:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>SAD</mi><mrow><mi>R</mi><mi>U</mi></mrow></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>x</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><munderover><mo>&Sigma;</mo><mrow><mi>y</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>+</mo><mn>1</mn><mo>,</mo><mi>y</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>|</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000823345610000021.GIF" wi="1377" he="160" /></maths>式(3)中,待估计PU的尺寸为N×N(N=4,8,16,32,64),p(x,y)为待估计PU中坐标为(x,y)的像素的像素值,其中x为水平坐标,y为竖直坐标,在待估计PU中它们的值为大于等于0且小于N的整数,坐标为(x+1,y‑1)的像素位于坐标为(x,y)的右上方;当Ω中存在编号为10的角度预测模式,即待估计PU可以采用水平向右方向进行预测的角度预测模式,则计算待估计PU中所有像素与其左方相邻像素的差值绝对值和SAD<sub>L</sub>,如式(4)所示:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>SAD</mi><mi>L</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>x</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><munderover><mo>&Sigma;</mo><mrow><mi>y</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>-</mo><mn>1</mn><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>|</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000823345610000022.GIF" wi="1300" he="171" /></maths>式(4)中,待估计PU的尺寸为N×N(N=4,8,16,32,64),p(x,y)为待估计PU中坐标为(x,y)的像素的像素值,其中x为水平坐标,y为竖直坐标,在待估计PU中它们的值为大于等于0且小于N的整数,坐标为(x‑1,y)的像素位于坐标为(x,y)的左方;当Ω中存在编号为2的角度预测模式,即待估计PU可以采用沿对角线右上方向进行预测的角度预测模式,则计算待估计PU中所有像素与其左下方相邻像素的差值绝对值和SAD<sub>LB</sub>,如式(5)所示:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>SAD</mi><mrow><mi>L</mi><mi>B</mi></mrow></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>x</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><munderover><mo>&Sigma;</mo><mrow><mi>y</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>-</mo><mn>1</mn><mo>,</mo><mi>y</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>|</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000823345610000023.GIF" wi="1371" he="166" /></maths>式(5)中,待估计PU的尺寸为N×N(N=4,8,16,32,64),p(x,y)为待估计PU中坐标为(x,y)的像素的像素值,其中x为水平坐标,y为竖直坐标,在待估计PU中它们的值为大于等于0且小于N的整数,坐标为(x‑1,y+1)的像素位于坐标为(x,y)的左下方;(3)根据不同方向空间相邻像素的差值绝对值和判断待估计PU的纹理方向特性:首先根据从步骤(2)计算得到的差值绝对值和SAD个数进行步骤选择:如果步骤(2)计算得到SAD个数小于3,则执行步骤(5);否则先对步骤(2)计算得到的SAD进行从小到大排列,对待估计PU的纹理方向特性进行分类;(4)根据纹理方向特性确定粗级模式搜索范围;(5)根据粗级模式搜索范围和Ω建立率失真优化候选模式集合;(6)选取最佳帧内预测模式:采用率失真优化技术从步骤(5)得到的候选模式集合中选取率失真代价最小的候选模式作为待估计PU的最佳帧内预测模式,完成待估计PU的帧内预测模式选择。
地址 310014 浙江省杭州市下城区朝晖六区