一种基于视频显著性的HEVC解码复杂度控制方法,申请号CN201610634377.1-传众专利搜索

发明名称	一种基于视频显著性的HEVC解码复杂度控制方法
摘要	本发明一种基于视频显著性的HEVC解码复杂度控制方法，属于视频解码领域；首先通过HEVC压缩域的区域显著性检测算法，预测每个LCU的显著性，然后选择若干个训练视频训练去块滤波器/简化运动补偿和解码复杂度/视频感知失真之间的函数关系；根据显著性图谱和函数关系建立HEVC解码复杂度控制与感知质量优化方程；最后通过求解该方程，达到精确控制HEVC解码复杂度，且保证感知失真最小的目的。优点在于：在控制解码复杂度时，最大程度地保证视频的感知质量；用户可以在解码端根据既定需求指定目标复杂度进行解码，从而将HEVC解码广泛地应用于具有不同计算能力或者不同电量的终端设备中，或在一定电量下完成指定时间内的视频播放。
申请公布号	CN106210717A	申请公布日期	2016.12.07
申请号	CN201610634377.1	申请日期	2016.08.05
申请人	北京航空航天大学;清华大学	发明人	徐迈;杨韧;陶晓明
分类号	H04N19/14(2014.01)I;H04N19/597(2014.01)I;H04N19/159(2014.01)I;H04N19/70(2014.01)I;H04N19/30(2014.01)I;H04N19/196(2014.01)I;H04N19/61(2014.01)I;H04N19/107(2014.01)I;H04N19/132(2014.01)I;H04N19/187(2014.01)I;H04N19/167(2014.01)I;H04N19/89(2014.01)I	主分类号	H04N19/14(2014.01)I
代理机构	北京永创新实专利事务所 11121	代理人	赵文利
主权项	一种基于视频显著性的HEVC解码复杂度控制方法，其特征在于，具体步骤如下：步骤一、针对某段视频，用户根据智能终端的计算能力、电量剩余或者根据自己的要求设定视频解码的目标复杂度；步骤二、利用HEVC压缩域的区域显著性检测算法，生成该视频中每一帧的LCU级别显著性图谱；LCU(Largest Coding Unit)是指最大编码单元；每帧中LCU的数量为N；步骤三、根据目标复杂度和LCU显著性图谱，设计解码复杂度—感知失真优化控制模型；优化控制模型为：视频的复杂度下降值大于等于目标下降值的时候，使得视频的主观失真最小，即<maths num="0001"><math><![CDATA[<mrow><munder><mi>min</mi><msubsup><mrow><mo>{</mo><msub><mi>f</mi><mi>n</mi></msub><mo>,</mo><msub><mi>g</mi><mi>n</mi></msub><mo>}</mo></mrow><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></msubsup></munder><munderover><mo>Σ</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mo>(</mo><msub><mi>ΔS</mi><mi>D</mi></msub><mrow><mo>(</mo><mrow><msub><mi>f</mi><mi>n</mi></msub><mo>,</mo><msub><mi>w</mi><mi>n</mi></msub></mrow><mo>)</mo></mrow><mo>+</mo><msub><mi>ΔS</mi><mi>M</mi></msub><mrow><mo>(</mo><mrow><msub><mi>g</mi><mi>n</mi></msub><mo>,</mo><msub><mi>w</mi><mi>n</mi></msub></mrow><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001070190900000011.GIF" wi="750" he="132" /></maths><maths num="0002"><math><![CDATA[<mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><munderover><mo>Σ</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mrow><mo>(</mo><msub><mi>ΔC</mi><mi>D</mi></msub><mo>(</mo><mrow><msub><mi>f</mi><mi>n</mi></msub><mo>,</mo><msub><mi>w</mi><mi>n</mi></msub></mrow><mo>)</mo><mo>+</mo><msub><mi>ΔC</mi><mi>M</mi></msub><mo>(</mo><msub><mi>g</mi><mi>n</mi></msub><mo>)</mo><mo>)</mo></mrow><mo>&GreaterEqual;</mo><msub><mi>ΔC</mi><mi>T</mi></msub></mrow>]]></math><img file="FDA0001070190900000012.GIF" wi="758" he="132" /></maths>ΔS<sub>D</sub>(f<sub>n</sub>,w<sub>n</sub>)为去掉/不去掉去块滤波器时的视频感知失真；w<sub>n</sub>为第n个LCU的显著性值；f<sub>n</sub>表示是否去掉第n个LCU的去块滤波器的参数；ΔS<sub>M</sub>(g<sub>n</sub>,w<sub>n</sub>)为简化运动补偿时的感知失真；g<sub>n</sub>表示第n个LCU中的每4个像素里，使用临近像素插值而不使用运动补偿算法的像素个数；g<sub>n</sub>的值为{0,1,2,3}；ΔC<sub>D</sub>(f<sub>n</sub>,w<sub>n</sub>)为去块滤波器与解码复杂度之间的函数表达式；ΔC<sub>M</sub>(g<sub>n</sub>)为简化运动补偿与解码复杂度之间的函数关系；ΔC<sub>T</sub>为特定视频解码复杂度的目标下降值；由于ΔS<sub>D</sub>(f<sub>n</sub>,w<sub>n</sub>)<<ΔS<sub>M</sub>(g<sub>n</sub>,w<sub>n</sub>)，优化方程分解并化简为：<img file="FDA0001070190900000013.GIF" wi="1541" he="287" />其中，ΔS<sub>D</sub>(f<sub>n</sub>,w<sub>n</sub>)归一化得到<img file="FDA0001070190900000014.GIF" wi="271" he="73" />ΔS<sub>M</sub>(g<sub>n</sub>,w<sub>n</sub>)归一化后得到<img file="FDA0001070190900000015.GIF" wi="277" he="75" />ΔC'<sub>T</sub>为特定视频需要通过简化运动补偿达到的解码复杂度的下降值；<maths num="0003"><math><![CDATA[<mrow><msubsup><mi>ΔC</mi><mi>T</mi><mo>′</mo></msubsup><mo>=</mo><msub><mi>ΔC</mi><mi>T</mi></msub><mo>-</mo><munderover><mo>Σ</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>ΔC</mi><mi>D</mi></msub><mrow><mo>(</mo><msub><mi>f</mi><mi>n</mi></msub><mo>=</mo><mn>1</mn><mo>,</mo><msub><mi>w</mi><mi>n</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>ΔC</mi><mi>T</mi></msub><mo>-</mo><munderover><mo>Σ</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>·</mo><mrow><mo>(</mo><mi>a</mi><mo>·</mo><msub><mi>w</mi><mi>n</mi></msub><mo>+</mo><mi>b</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001070190900000016.GIF" wi="1166" he="135" /></maths>参数a和b的值随量化参数QP(Quantization Parameter)的变化而变化；步骤四、利用解码复杂度—感知失真优化控制模型，控制视频的实际解码复杂度；达到视频的解码复杂度等于设定的目标复杂度，并且保证视频的感知失真最小的目的；若<img file="FDA0001070190900000017.GIF" wi="538" he="126" />结果为：<img file="FDA0001070190900000018.GIF" wi="333" he="130" />其中，I满足：<maths num="0004"><math><![CDATA[<mrow><mfrac><mn>1</mn><mi>N</mi></mfrac><munderover><mo>Σ</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>I</mi></munderover><mrow><mo>(</mo><mi>a</mi><mo>·</mo><msub><mover><mi>w</mi><mo>~</mo></mover><mi>n</mi></msub><mo>+</mo><mi>b</mi><mo>)</mo></mrow><mo>&GreaterEqual;</mo><msub><mi>ΔC</mi><mi>T</mi></msub><mo>></mo><mfrac><mn>1</mn><mi>N</mi></mfrac><munderover><mo>Σ</mo><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>I</mi><mo>-</mo><mn>1</mn></mrow></munderover><mrow><mo>(</mo><mi>a</mi><mo>·</mo><msub><mover><mi>w</mi><mo>~</mo></mover><mi>n</mi></msub><mo>+</mo><mi>b</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001070190900000021.GIF" wi="838" he="127" /></maths><img file="FDA0001070190900000022.GIF" wi="147" he="79" />为<img file="FDA0001070190900000023.GIF" wi="147" he="79" />的升序排列；若<img file="FDA0001070190900000024.GIF" wi="537" he="133" />结果为：<img file="FDA0001070190900000025.GIF" wi="646" he="328" />其中，N<sub>1</sub>，N<sub>2</sub>和N<sub>3</sub>分别为g<sub>n</sub>＝1,2,3的LCU个数，通过以下公式求得：<maths num="0005"><math><![CDATA[<mrow><munder><mi>min</mi><mrow><msub><mi>N</mi><mn>3</mn></msub><mo>,</mo><msub><mi>N</mi><mn>2</mn></msub><mo>,</mo><msub><mi>N</mi><mn>1</mn></msub></mrow></munder><msubsup><mi>N</mi><mn>2</mn><mn>3</mn></msubsup><mo>+</mo><mrow><mo>(</mo><mn>8</mn><msub><mi>h</mi><mn>1</mn></msub><mo>+</mo><mn>4</mn><msub><mi>h</mi><mn>2</mn></msub><mo>+</mo><mn>2</mn><msub><mi>h</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>·</mo><mrow><mo>(</mo><msubsup><mi>N</mi><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>N</mi><mn>3</mn><mn>2</mn></msubsup><mo>)</mo></mrow><mo>+</mo><mrow><mo>(</mo><msub><mi>h</mi><mn>1</mn></msub><mo>+</mo><msub><mi>h</mi><mn>2</mn></msub><mo>+</mo><msub><mi>h</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>·</mo><mrow><mo>(</mo><msubsup><mi>N</mi><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>N</mi><mn>1</mn><mn>2</mn></msubsup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001070190900000026.GIF" wi="1302" he="92" /></maths><maths num="0006"><math><![CDATA[<mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>·</mo><mi>c</mi><mo>·</mo><mrow><mo>(</mo><msub><mi>N</mi><mn>1</mn></msub><mo>+</mo><mn>2</mn><msub><mi>N</mi><mn>2</mn></msub><mo>+</mo><mn>3</mn><msub><mi>N</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>&GreaterEqual;</mo><msubsup><mi>ΔC</mi><mi>T</mi><mo>′</mo></msubsup></mrow>]]></math><img file="FDA0001070190900000027.GIF" wi="669" he="114" /></maths>参数h<sub>1</sub>、h<sub>2</sub>和h<sub>3</sub>的值为常数；参数c的值随量化参数QP的变化而变化；两个求解结果为在满足约束条件的前提下，给显著性w<sub>n</sub>较小的LCU分配较大的f<sub>n</sub>和g<sub>n</sub>。
地址	100191 北京市海淀区学院路37号