发明名称 一种基于视频显著性的HEVC解码复杂度控制方法
摘要 本发明一种基于视频显著性的HEVC解码复杂度控制方法,属于视频解码领域;首先通过HEVC压缩域的区域显著性检测算法,预测每个LCU的显著性,然后选择若干个训练视频训练去块滤波器/简化运动补偿和解码复杂度/视频感知失真之间的函数关系;根据显著性图谱和函数关系建立HEVC解码复杂度控制与感知质量优化方程;最后通过求解该方程,达到精确控制HEVC解码复杂度,且保证感知失真最小的目的。优点在于:在控制解码复杂度时,最大程度地保证视频的感知质量;用户可以在解码端根据既定需求指定目标复杂度进行解码,从而将HEVC解码广泛地应用于具有不同计算能力或者不同电量的终端设备中,或在一定电量下完成指定时间内的视频播放。
申请公布号 CN106210717A 申请公布日期 2016.12.07
申请号 CN201610634377.1 申请日期 2016.08.05
申请人 北京航空航天大学;清华大学 发明人 徐迈;杨韧;陶晓明
分类号 H04N19/14(2014.01)I;H04N19/597(2014.01)I;H04N19/159(2014.01)I;H04N19/70(2014.01)I;H04N19/30(2014.01)I;H04N19/196(2014.01)I;H04N19/61(2014.01)I;H04N19/107(2014.01)I;H04N19/132(2014.01)I;H04N19/187(2014.01)I;H04N19/167(2014.01)I;H04N19/89(2014.01)I 主分类号 H04N19/14(2014.01)I
代理机构 北京永创新实专利事务所 11121 代理人 赵文利
主权项 一种基于视频显著性的HEVC解码复杂度控制方法,其特征在于,具体步骤如下:步骤一、针对某段视频,用户根据智能终端的计算能力、电量剩余或者根据自己的要求设定视频解码的目标复杂度;步骤二、利用HEVC压缩域的区域显著性检测算法,生成该视频中每一帧的LCU级别显著性图谱;LCU(Largest Coding Unit)是指最大编码单元;每帧中LCU的数量为N;步骤三、根据目标复杂度和LCU显著性图谱,设计解码复杂度—感知失真优化控制模型;优化控制模型为:视频的复杂度下降值大于等于目标下降值的时候,使得视频的主观失真最小,即<maths num="0001"><math><![CDATA[<mrow><munder><mi>min</mi><msubsup><mrow><mo>{</mo><msub><mi>f</mi><mi>n</mi></msub><mo>,</mo><msub><mi>g</mi><mi>n</mi></msub><mo>}</mo></mrow><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></msubsup></munder><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mo>(</mo><msub><mi>&Delta;S</mi><mi>D</mi></msub><mrow><mo>(</mo><mrow><msub><mi>f</mi><mi>n</mi></msub><mo>,</mo><msub><mi>w</mi><mi>n</mi></msub></mrow><mo>)</mo></mrow><mo>+</mo><msub><mi>&Delta;S</mi><mi>M</mi></msub><mrow><mo>(</mo><mrow><msub><mi>g</mi><mi>n</mi></msub><mo>,</mo><msub><mi>w</mi><mi>n</mi></msub></mrow><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001070190900000011.GIF" wi="750" he="132" /></maths><maths num="0002"><math><![CDATA[<mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mrow><mo>(</mo><msub><mi>&Delta;C</mi><mi>D</mi></msub><mo>(</mo><mrow><msub><mi>f</mi><mi>n</mi></msub><mo>,</mo><msub><mi>w</mi><mi>n</mi></msub></mrow><mo>)</mo><mo>+</mo><msub><mi>&Delta;C</mi><mi>M</mi></msub><mo>(</mo><msub><mi>g</mi><mi>n</mi></msub><mo>)</mo><mo>)</mo></mrow><mo>&GreaterEqual;</mo><msub><mi>&Delta;C</mi><mi>T</mi></msub></mrow>]]></math><img file="FDA0001070190900000012.GIF" wi="758" he="132" /></maths>ΔS<sub>D</sub>(f<sub>n</sub>,w<sub>n</sub>)为去掉/不去掉去块滤波器时的视频感知失真;w<sub>n</sub>为第n个LCU的显著性值;f<sub>n</sub>表示是否去掉第n个LCU的去块滤波器的参数;ΔS<sub>M</sub>(g<sub>n</sub>,w<sub>n</sub>)为简化运动补偿时的感知失真;g<sub>n</sub>表示第n个LCU中的每4个像素里,使用临近像素插值而不使用运动补偿算法的像素个数;g<sub>n</sub>的值为{0,1,2,3};ΔC<sub>D</sub>(f<sub>n</sub>,w<sub>n</sub>)为去块滤波器与解码复杂度之间的函数表达式;ΔC<sub>M</sub>(g<sub>n</sub>)为简化运动补偿与解码复杂度之间的函数关系;ΔC<sub>T</sub>为特定视频解码复杂度的目标下降值;由于ΔS<sub>D</sub>(f<sub>n</sub>,w<sub>n</sub>)&lt;&lt;ΔS<sub>M</sub>(g<sub>n</sub>,w<sub>n</sub>),优化方程分解并化简为:<img file="FDA0001070190900000013.GIF" wi="1541" he="287" />其中,ΔS<sub>D</sub>(f<sub>n</sub>,w<sub>n</sub>)归一化得到<img file="FDA0001070190900000014.GIF" wi="271" he="73" />ΔS<sub>M</sub>(g<sub>n</sub>,w<sub>n</sub>)归一化后得到<img file="FDA0001070190900000015.GIF" wi="277" he="75" />ΔC'<sub>T</sub>为特定视频需要通过简化运动补偿达到的解码复杂度的下降值;<maths num="0003"><math><![CDATA[<mrow><msubsup><mi>&Delta;C</mi><mi>T</mi><mo>&prime;</mo></msubsup><mo>=</mo><msub><mi>&Delta;C</mi><mi>T</mi></msub><mo>-</mo><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&Delta;C</mi><mi>D</mi></msub><mrow><mo>(</mo><msub><mi>f</mi><mi>n</mi></msub><mo>=</mo><mn>1</mn><mo>,</mo><msub><mi>w</mi><mi>n</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>&Delta;C</mi><mi>T</mi></msub><mo>-</mo><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>&CenterDot;</mo><mrow><mo>(</mo><mi>a</mi><mo>&CenterDot;</mo><msub><mi>w</mi><mi>n</mi></msub><mo>+</mo><mi>b</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001070190900000016.GIF" wi="1166" he="135" /></maths>参数a和b的值随量化参数QP(Quantization Parameter)的变化而变化;步骤四、利用解码复杂度—感知失真优化控制模型,控制视频的实际解码复杂度;达到视频的解码复杂度等于设定的目标复杂度,并且保证视频的感知失真最小的目的;若<img file="FDA0001070190900000017.GIF" wi="538" he="126" />结果为:<img file="FDA0001070190900000018.GIF" wi="333" he="130" />其中,I满足:<maths num="0004"><math><![CDATA[<mrow><mfrac><mn>1</mn><mi>N</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>I</mi></munderover><mrow><mo>(</mo><mi>a</mi><mo>&CenterDot;</mo><msub><mover><mi>w</mi><mo>~</mo></mover><mi>n</mi></msub><mo>+</mo><mi>b</mi><mo>)</mo></mrow><mo>&GreaterEqual;</mo><msub><mi>&Delta;C</mi><mi>T</mi></msub><mo>&gt;</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>I</mi><mo>-</mo><mn>1</mn></mrow></munderover><mrow><mo>(</mo><mi>a</mi><mo>&CenterDot;</mo><msub><mover><mi>w</mi><mo>~</mo></mover><mi>n</mi></msub><mo>+</mo><mi>b</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001070190900000021.GIF" wi="838" he="127" /></maths><img file="FDA0001070190900000022.GIF" wi="147" he="79" />为<img file="FDA0001070190900000023.GIF" wi="147" he="79" />的升序排列;若<img file="FDA0001070190900000024.GIF" wi="537" he="133" />结果为:<img file="FDA0001070190900000025.GIF" wi="646" he="328" />其中,N<sub>1</sub>,N<sub>2</sub>和N<sub>3</sub>分别为g<sub>n</sub>=1,2,3的LCU个数,通过以下公式求得:<maths num="0005"><math><![CDATA[<mrow><munder><mi>min</mi><mrow><msub><mi>N</mi><mn>3</mn></msub><mo>,</mo><msub><mi>N</mi><mn>2</mn></msub><mo>,</mo><msub><mi>N</mi><mn>1</mn></msub></mrow></munder><msubsup><mi>N</mi><mn>2</mn><mn>3</mn></msubsup><mo>+</mo><mrow><mo>(</mo><mn>8</mn><msub><mi>h</mi><mn>1</mn></msub><mo>+</mo><mn>4</mn><msub><mi>h</mi><mn>2</mn></msub><mo>+</mo><mn>2</mn><msub><mi>h</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>&CenterDot;</mo><mrow><mo>(</mo><msubsup><mi>N</mi><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>N</mi><mn>3</mn><mn>2</mn></msubsup><mo>)</mo></mrow><mo>+</mo><mrow><mo>(</mo><msub><mi>h</mi><mn>1</mn></msub><mo>+</mo><msub><mi>h</mi><mn>2</mn></msub><mo>+</mo><msub><mi>h</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>&CenterDot;</mo><mrow><mo>(</mo><msubsup><mi>N</mi><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>N</mi><mn>1</mn><mn>2</mn></msubsup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001070190900000026.GIF" wi="1302" he="92" /></maths><maths num="0006"><math><![CDATA[<mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>&CenterDot;</mo><mi>c</mi><mo>&CenterDot;</mo><mrow><mo>(</mo><msub><mi>N</mi><mn>1</mn></msub><mo>+</mo><mn>2</mn><msub><mi>N</mi><mn>2</mn></msub><mo>+</mo><mn>3</mn><msub><mi>N</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>&GreaterEqual;</mo><msubsup><mi>&Delta;C</mi><mi>T</mi><mo>&prime;</mo></msubsup></mrow>]]></math><img file="FDA0001070190900000027.GIF" wi="669" he="114" /></maths>参数h<sub>1</sub>、h<sub>2</sub>和h<sub>3</sub>的值为常数;参数c的值随量化参数QP的变化而变化;两个求解结果为在满足约束条件的前提下,给显著性w<sub>n</sub>较小的LCU分配较大的f<sub>n</sub>和g<sub>n</sub>。
地址 100191 北京市海淀区学院路37号