发明名称 彩色与深度视频联合编码的比特分配及码率控制算法
摘要 本发明属于3D视频编码领域,为解决JVT-G012中码率控制与彩色深度视频之间比特分配不兼容的问题,同时更加准确的实现彩色/深度层及帧层的联合码率控制,为此,本发明采取的技术方案是,彩色与深度视频联合编码的比特分配及码率控制算法,包括如下步骤:1)建立虚拟视点失真模型:2)建立彩色及深度视频的失真模型D<sub>t</sub>-R<sub>t</sub>和D<sub>d</sub>-R<sub>d</sub>:3)建立D<sub>v</sub>-R<sub>t</sub>-R<sub>t</sub>模型:4)计算当前编码视频的目标比特:5)基于计算的最优目标比特率进行编码。本发明主要应用于3D视频编码。
申请公布号 CN104284196A 申请公布日期 2015.01.14
申请号 CN201410587503.3 申请日期 2014.10.28
申请人 天津大学 发明人 雷建军;李贞贞;侯春萍;胡春悦;朱涛;金鹏
分类号 H04N19/597(2014.01)I;H04N19/147(2014.01)I;H04N19/19(2014.01)I 主分类号 H04N19/597(2014.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 刘国威
主权项 一种彩色与深度视频联合编码的比特分配及码率控制算法,其特征是,包括如下步骤:1)建立虚拟视点失真模型:在不同的给定目标比特R<sub>T</sub>下预编码彩色视频及与之对应的深度视频,并采用虚拟视点绘制方法绘制虚拟视点;统计虚拟视点失真D<sub>v</sub>,深度视频失真D<sub>d</sub>与彩色视频失真D<sub>t</sub>,建立模型,拟合模型参数,具体虚拟视点失真模型表示为:D<sub>v</sub>=A·D<sub>t</sub>+B·D<sub>d</sub>+C<sub>0</sub>其中,A、B分别代表D<sub>t</sub>和D<sub>d</sub>对虚拟视点失真D<sub>v</sub>的影响因子,C<sub>0</sub>是一个常数;2)建立彩色及深度视频的失真模型D<sub>t</sub>‑R<sub>t</sub>和D<sub>d</sub>‑R<sub>d</sub>:统计彩色视频/深度视频编码失真,输出比特率及对应的目标比特率,建立模型。3)建立D<sub>v</sub>‑R<sub>t</sub>‑R<sub>t</sub>模型:统计虚拟视点失真D<sub>v</sub>,深度视频目标比特R<sub>d</sub>与彩色视频目标比特R<sub>t</sub>,并建立模型。由步骤1和2可以推导出D<sub>v</sub>‑R<sub>t</sub>‑R<sub>t</sub>,具体表示为:<img file="FDA0000595639300000011.GIF" wi="1180" he="350" />其中,μ,ν分别代表R<sub>t</sub>和R<sub>d</sub>在虚拟视点的失真D<sub>v</sub>的影响因子,C是一个常数;4)计算当前编码视频的目标比特:比特分配方案为:在总比特率R<sub>C</sub>的约束下,最小化的虚拟视点的失真,表示为arg min D<sub>v</sub>s.t.R<sub>t</sub>+R<sub>d</sub>≤R<sub>C</sub>基于D<sub>v</sub>‑R<sub>t</sub>‑R<sub>d</sub>模型,最优比特分配问题可以改写为如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><munder><mrow><mi>arg</mi><mi> </mi><mi>min</mi></mrow><mrow><mrow><mo>(</mo><msub><mi>R</mi><mi>t</mi></msub><mo>,</mo><msub><mi>R</mi><mi>d</mi></msub><mo>)</mo></mrow><mo>&Element;</mo><mi>&Omega;</mi></mrow></munder><mrow><mo>(</mo><mi>&mu;</mi><mo>&CenterDot;</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><msub><mi>&beta;</mi><mi>t</mi></msub><mo>&CenterDot;</mo><msub><mi>R</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>v</mi><mo>&CenterDot;</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><msub><mi>&beta;</mi><mi>d</mi></msub><mo>&CenterDot;</mo><msub><mi>R</mi><mi>d</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>C</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000595639300000012.GIF" wi="963" he="109" /></maths>s.t.R<sub>t</sub>+R<sub>d</sub>≤R<sub>C</sub>st.表示使满足,采用拉格朗日乘数法来解决在限制条件下求比特分配的最优解的问题。将限制条件下求极值的问题映射到等价的无约束条件的求极值问题,如下:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><munder><mi>min</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>t</mi></msub><mo>,</mo><msub><mi>R</mi><mi>d</mi></msub><mo>)</mo></mrow></munder><mi>J</mi><mo>=</mo><mo>{</mo><mi>&mu;</mi><mo>&CenterDot;</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><msub><mi>&beta;</mi><mi>t</mi></msub><mo>&CenterDot;</mo><msub><mi>R</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>v</mi><mo>&CenterDot;</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><msub><mi>&beta;</mi><mi>d</mi></msub><mo>&CenterDot;</mo><msub><mi>R</mi><mi>d</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>C</mi><mo>+</mo><mi>&lambda;</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>d</mi></msub><mo>+</mo><msub><mi>R</mi><mi>t</mi></msub><mo>-</mo><msub><mi>R</mi><mi>C</mi></msub><mo>)</mo></mrow><mo>}</mo></mrow>]]></math><img file="FDA0000595639300000013.GIF" wi="1347" he="99" /></maths>其中,λ是拉格朗日乘子,最优的彩色及深度视频的目标比特率R<sub>t</sub>和R<sub>d</sub>可以通过求解以下解方程组得到<maths num="0003" id="cmaths0003"><math><![CDATA[<mfenced open='{' close=''><mtable><mtr><mtd><mfrac><mrow><mo>&PartialD;</mo><mi>J</mi></mrow><msub><mrow><mo>&PartialD;</mo><mi>R</mi></mrow><mi>t</mi></msub></mfrac><mo>=</mo><mo>-</mo><mi>&mu;</mi><mo>&CenterDot;</mo><msub><mi>&beta;</mi><mi>t</mi></msub><mo>&CenterDot;</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><msub><mi>&beta;</mi><mi>t</mi></msub><mo>&CenterDot;</mo><msub><mi>R</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>&lambda;</mi><mo>=</mo><mn>0</mn></mtd></mtr><mtr><mtd><mfrac><mrow><mo>&PartialD;</mo><mi>J</mi></mrow><msub><mrow><mo>&PartialD;</mo><mi>R</mi></mrow><mi>d</mi></msub></mfrac><mo>=</mo><mo>-</mo><mi>v</mi><mo>&CenterDot;</mo><msub><mi>&beta;</mi><mi>d</mi></msub><mo>&CenterDot;</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><msub><mi>&beta;</mi><mi>d</mi></msub><mo>&CenterDot;</mo><msub><mi>R</mi><mi>d</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>&lambda;</mi><mo>=</mo><mn>0</mn></mtd></mtr><mtr><mtd><mfrac><mrow><mo>&PartialD;</mo><mi>J</mi></mrow><mrow><mo>&PartialD;</mo><mi>&lambda;</mi></mrow></mfrac><mo>=</mo><msub><mi>R</mi><mi>d</mi></msub><mo>+</mo><msub><mi>R</mi><mi>t</mi></msub><mo>-</mo><msub><mi>R</mi><mi>C</mi></msub><mo>=</mo><mn>0</mn></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000595639300000014.GIF" wi="754" he="440" /></maths>从而,最优目标比特率R<sub>t</sub>和R<sub>d</sub>的计算如下:<maths num="0004" id="cmaths0004"><math><![CDATA[<mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>R</mi><mi>t</mi></msub><mo>=</mo><mfrac><mrow><msub><mi>&beta;</mi><mi>d</mi></msub><mo>&CenterDot;</mo><msub><mi>R</mi><mi>C</mi></msub><mo>+</mo><mi>ln</mi><mrow><mo>(</mo><mfrac><mrow><mi>&mu;</mi><mo>&CenterDot;</mo><msub><mi>&beta;</mi><mi>t</mi></msub></mrow><mrow><mi>v</mi><mo>&CenterDot;</mo><msub><mi>&beta;</mi><mi>d</mi></msub></mrow></mfrac><mo>)</mo></mrow></mrow><mrow><msub><mi>&beta;</mi><mi>t</mi></msub><mo>+</mo><msub><mi>&beta;</mi><mi>d</mi></msub></mrow></mfrac></mtd></mtr><mtr><mtd><msub><mi>R</mi><mi>d</mi></msub><mo>=</mo><mfrac><mrow><msub><mi>&beta;</mi><mi>t</mi></msub><mo>&CenterDot;</mo><msub><mi>R</mi><mi>C</mi></msub><mo>-</mo><mi>ln</mi><mrow><mo>(</mo><mfrac><mrow><mi>&mu;</mi><mo>&CenterDot;</mo><msub><mi>&beta;</mi><mi>t</mi></msub></mrow><mrow><mi>v</mi><mo>&CenterDot;</mo><msub><mi>&beta;</mi><mi>d</mi></msub></mrow></mfrac><mo>)</mo></mrow></mrow><mrow><msub><mi>&beta;</mi><mi>t</mi></msub><mo>+</mo><msub><mi>&beta;</mi><mi>d</mi></msub></mrow></mfrac></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000595639300000021.GIF" wi="518" he="443" /></maths>5)基于计算的最优目标比特率进行编码。
地址 300072 天津市南开区卫津路92号