发明名称 视频标准中基于自回归模型的帧内预测快速模式选择方法
摘要 本发明公开了一种视频标准中基于自回归模型的帧内预测快速模式选择方法,主要解决现有H.265/HEVC标准中帧内预测模式选择复杂度高的问题。其实现步骤为:对当前预测单元进行粗略模式选择,得到m种候选模式;加入最有可能模式,得到m1种候选模式;对m1种候选模式的代价函数值进行升序排序;将相邻两个代价值的差值和两者平均值的比值与基于自回归模型得到的门限进行对比,自适应地选出n种最终候选模式进行率失真优化。本发明操作简单,在保持图像压缩性能的同时,缩短了运行时间,为H.265/HEVC标准的实时实现提供了技术基础,可用于所有基于H.265/HEVC标准的视频压缩编码端中的帧内预测模式选择。
申请公布号 CN103929652B 申请公布日期 2017.04.19
申请号 CN201410182758.1 申请日期 2014.04.30
申请人 西安电子科技大学 发明人 李甫;焦丹丹;石光明;宋晓丹;樊春晓;牛毅
分类号 H04N19/61(2014.01)I;H04N19/13(2014.01)I;H04N19/122(2014.01)I;H04N19/567(2014.01)I 主分类号 H04N19/61(2014.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 一种视频标准中基于自回归模型的帧内预测快速模式选择方法,包括如下步骤:(1)将待处理视频的帧内图像划分成编码单元,并对编码单元按照帧内划分方式划分为大小为4×4、8×8、16×16、32×32和64×64的若干块,选取其中一块作为预测单元PU;(2)对预测单元PU先进行粗略模式选择RMD过程,再根据哈德玛代价SATD代价函数选出前m种预测模式作为候选模式,记为候选集合M,并把该m种预测模式的SATD代价函数值记为<img file="FDA0001146614830000011.GIF" wi="571" he="62" />存入数组S1;(3)利用H.265/HEVC标准中给定的最有可能模式MPM算法对预测单元PU进行预测,得到最有可能模式MPM;(4)判断步骤(3)得到最有可能模式MPM是否包含在候选集合M中,如果包含在候选集合M中,则执行步骤(6),反之,则执行步骤(5);(5)将最有可能模式MPM加入到候选集合M中,并将最有可能模式MPM对应的SATD代价函数值SatdCost加入到数组S1,然后对数组S1中元素进行从小到大排序,再依据数组S1中元素的顺序更新相应的候选模式在候选集合M中的位置,并将候选集合M中的候选模式记为P<sub>1</sub>~P<sub>m1</sub>,并把对应的SATD代价函数值记为<img file="FDA0001146614830000012.GIF" wi="581" he="62" />(6)根据该代价函数值用基于自回归模型的自适应模式选择模型对候选集合M中的候选模式P<sub>1</sub>~P<sub>m1</sub>进行筛选,选出前n种候选模式作为最终候选模式集合N:(6a)根据所选预测单元PU的尺寸,选择预测单元PU门限值<img file="FDA0001146614830000013.GIF" wi="58" he="62" />的计算公式:对于选取尺寸为4×4的预测单元PU,则执行步骤(6b),对于选取尺寸为8×8的预测单元PU,则执行步骤(6c),对于选取尺寸为16×16的预测单元PU,则执行步骤(6d),对于选取尺寸为32×32的预测单元PU,则执行步骤(6e),对于选取尺寸为64×64的预测单元PU,则执行步骤(6f);(6b)根据H.265/HEVC标准,通过基于自回归模型的公式,计算所选预测单元PU的门限值<img file="FDA0001146614830000014.GIF" wi="83" he="63" /><maths num="0001"><math><![CDATA[<mrow><msub><mo>&part;</mo><mi>N</mi></msub><mo>=</mo><mrow><mo>(</mo><msub><mo>&part;</mo><mrow><mi>a</mi><mi>l</mi></mrow></msub><mo>+</mo><mn>2</mn><mo>&times;</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>1</mn></msub></msub><mo>+</mo><mn>2</mn><mo>&times;</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>1</mn></msub></msub><mo>)</mo></mrow><mo>/</mo><mn>5</mn><mo>,</mo></mrow>]]></math><img file="FDA0001146614830000015.GIF" wi="726" he="85" /></maths>其中,<img file="FDA0001146614830000021.GIF" wi="59" he="63" />是与所选预测单元PU相邻且位于所选预测单元PU左上方的基本单元门限值,<img file="FDA0001146614830000022.GIF" wi="53" he="54" />是与所选预测单元PU相邻且位于所选预测单元PU左侧的基本单元门限值,<img file="FDA0001146614830000023.GIF" wi="53" he="55" />是与所选预测单元PU相邻且位于所选预测单元PU上方的基本单元门限值;(6c)根据H.265/HEVC标准,通过基于自回归模型的公式,计算所选预测单元PU的门限值<img file="FDA0001146614830000024.GIF" wi="83" he="63" /><maths num="0002"><math><![CDATA[<mrow><msub><mo>&part;</mo><mi>N</mi></msub><mo>=</mo><mrow><mo>(</mo><msub><mo>&part;</mo><mrow><mi>a</mi><mi>l</mi></mrow></msub><mo>+</mo><mn>2</mn><mo>&times;</mo><mo>(</mo><mrow><msub><mo>&part;</mo><msub><mi>l</mi><mn>1</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>2</mn></msub></msub></mrow><mo>)</mo><mo>+</mo><mn>2</mn><mo>&times;</mo><mo>(</mo><mrow><msub><mo>&part;</mo><msub><mi>a</mi><mn>1</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>2</mn></msub></msub></mrow><mo>)</mo><mo>)</mo></mrow><mo>/</mo><mn>9</mn><mo>,</mo></mrow>]]></math><img file="FDA0001146614830000025.GIF" wi="1046" he="79" /></maths>其中,<img file="FDA0001146614830000026.GIF" wi="62" he="62" />是与所选预测单元PU相邻且位于所选预测单元PU左上方的基本单元门限值,<img file="FDA0001146614830000027.GIF" wi="106" he="63" /><img file="FDA0001146614830000028.GIF" wi="53" he="63" />是与所选预测单元PU相邻且位于<img file="FDA0001146614830000029.GIF" wi="60" he="63" />下方从上而下依次排列的两个基本单元门限值;<img file="FDA00011466148300000210.GIF" wi="82" he="62" /><img file="FDA00011466148300000211.GIF" wi="54" he="55" />是与所选预测单元PU相邻且位于<img file="FDA00011466148300000212.GIF" wi="59" he="68" />右方从左至右依次排列的两个基本单元门限值;(6d)根据H.265/HEVC标准,通过基于自回归模型的公式,计算所选预测单元PU的门限值<img file="FDA00011466148300000213.GIF" wi="83" he="60" /><maths num="0003"><math><![CDATA[<mrow><msub><mo>&part;</mo><mi>N</mi></msub><mo>=</mo><mrow><mo>(</mo><msub><mo>&part;</mo><mrow><mi>a</mi><mi>l</mi></mrow></msub><mo>+</mo><mn>2</mn><mo>&times;</mo><mo>(</mo><mrow><msub><mo>&part;</mo><msub><mi>l</mi><mn>1</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>2</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>3</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>4</mn></msub></msub></mrow><mo>)</mo><mo>+</mo><mn>2</mn><mo>&times;</mo><mo>(</mo><mrow><msub><mo>&part;</mo><msub><mi>a</mi><mn>1</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>2</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>3</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>4</mn></msub></msub></mrow><mo>)</mo><mo>)</mo></mrow><mo>/</mo><mn>17</mn><mo>,</mo></mrow>]]></math><img file="FDA00011466148300000214.GIF" wi="1550" he="87" /></maths>其中,<img file="FDA00011466148300000215.GIF" wi="62" he="63" />是与所选预测单元PU相邻且位于所选预测单元PU左上方的基本单元门限值,<img file="FDA00011466148300000216.GIF" wi="79" he="63" /><img file="FDA00011466148300000217.GIF" wi="277" he="55" />是与所选预测单元PU相邻且位于<img file="FDA00011466148300000218.GIF" wi="59" he="62" />下方从上而下依次排列的四个基本单元门限值;<img file="FDA00011466148300000219.GIF" wi="386" he="63" />是与所选预测单元PU相邻且位于<img file="FDA00011466148300000220.GIF" wi="60" he="63" />右方从左至右依次排列的四个基本单元门限值;(6e)根据H.265/HEVC标准,用基于自回归模型的公式,计算所选预测单元PU的门限值<img file="FDA00011466148300000221.GIF" wi="83" he="63" /><maths num="0004"><math><![CDATA[<mrow><mtable><mtr><mtd><mrow><msub><mo>&part;</mo><mi>N</mi></msub><mo>=</mo><mrow><mo>(</mo><msub><mo>&part;</mo><mrow><mi>a</mi><mi>l</mi></mrow></msub><mo>+</mo><mn>2</mn><mo>&times;</mo><mo>(</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>1</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>2</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>3</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>4</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>5</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>6</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>7</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>8</mn></msub></msub><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mo>+</mo><mn>2</mn><mo>&times;</mo><mrow><mo>(</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>1</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>2</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>3</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>4</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>5</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>6</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>7</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>8</mn></msub></msub><mo>)</mo></mrow><mo>)</mo><mo>/</mo><mn>33</mn></mrow></mtd></mtr></mtable><mo>,</mo></mrow>]]></math><img file="FDA00011466148300000222.GIF" wi="1301" he="159" /></maths>其中,<img file="FDA00011466148300000223.GIF" wi="59" he="63" />是与所选预测单元PU相邻且位于所选预测单元PU左上方的基本单元门限值,<img file="FDA00011466148300000224.GIF" wi="108" he="60" /><img file="FDA00011466148300000225.GIF" wi="726" he="62" />是与所选预测单元PU相邻且位于<img file="FDA00011466148300000226.GIF" wi="59" he="63" />下方从上而下依次排列的八个基本单元门限值;<img file="FDA00011466148300000227.GIF" wi="894" he="63" />是与所选预测单元PU相邻且位于<img file="FDA00011466148300000228.GIF" wi="61" he="62" />右方从左至右依次排列的八个基本单元门限值;(6f)根据H.265/HEVC标准,用基于自回归模型的公式,计算所选预测单元PU的门限值<img file="FDA0001146614830000031.GIF" wi="83" he="62" /><maths num="0005"><math><![CDATA[<mrow><mtable><mtr><mtd><mrow><msub><mo>&part;</mo><mi>N</mi></msub><mo>=</mo><mo>(</mo><msub><mo>&part;</mo><mrow><mi>a</mi><mi>l</mi></mrow></msub><mo>+</mo><mn>2</mn><mo>&times;</mo><mo>(</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>1</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>2</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>3</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>4</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>5</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>6</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>7</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>8</mn></msub></msub></mrow></mtd></mtr><mtr><mtd><mrow><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>9</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><mrow><mi>l</mi><msub><mo>`</mo><mn>10</mn></msub></mrow></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>11</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>12</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>13</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>14</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>15</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>l</mi><mn>16</mn></msub></msub><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mrow><mo>+</mo><mn>2</mn><mo>&times;</mo><mo>(</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>1</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>2</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>3</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>4</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>5</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>6</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>7</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>8</mn></msub></msub></mrow></mtd></mtr><mtr><mtd><mrow><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>9</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>10</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>11</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>12</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>13</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>14</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>15</mn></msub></msub><mo>+</mo><msub><mo>&part;</mo><msub><mi>a</mi><mn>16</mn></msub></msub><mo>)</mo><mo>)</mo><mo>/</mo><mn>65</mn></mrow></mtd></mtr></mtable><mo>,</mo></mrow>]]></math><img file="FDA0001146614830000032.GIF" wi="1284" he="319" /></maths>其中,<img file="FDA0001146614830000033.GIF" wi="65" he="62" />是与所选预测单元PU相邻且位于所选预测单元PU左上方的基本单元门限值,<img file="FDA0001146614830000034.GIF" wi="108" he="62" /><img file="FDA0001146614830000035.GIF" wi="1782" he="63" />是与所选预测单元PU相邻且位于<img file="FDA0001146614830000036.GIF" wi="62" he="63" />下方从上而下依次排列的十六个基本单元门限值;<img file="FDA0001146614830000037.GIF" wi="286" he="62" /><img file="FDA0001146614830000038.GIF" wi="1510" he="55" />是与所选预测单元PU相邻且位于<img file="FDA0001146614830000039.GIF" wi="61" he="63" />右方从左至右依次排列的十六个基本单元门限值;(6g)把SatdCost<sub>p1</sub>对应的预测模式P<sub>1</sub>作为最终候选模式集合N的初始值,此时N={P<sub>1</sub>},初始化候选模式索引n=1;(6h)计算数组S1中<img file="FDA00011466148300000310.GIF" wi="552" he="55" />的相邻两个元素<img file="FDA00011466148300000311.GIF" wi="531" he="55" />的差和两者平均值的比值,如果所得比值与门限<img file="FDA00011466148300000312.GIF" wi="51" he="47" />的关系满足<maths num="0006"><math><![CDATA[<mrow><msub><mi>SatdCost</mi><msub><mi>p</mi><mrow><mi>n</mi><mo>+</mo><mn>1</mn></mrow></msub></msub><mo>-</mo><msub><mi>SatdCost</mi><msub><mi>p</mi><mi>n</mi></msub></msub><mo>&le;</mo><msub><mo>&part;</mo><mi>N</mi></msub><mrow><mo>(</mo><msub><mi>SatdCost</mi><msub><mi>p</mi><mrow><mi>n</mi><mo>+</mo><mn>1</mn></mrow></msub></msub><mo>+</mo><msub><mi>SatdCost</mi><msub><mi>p</mi><mi>n</mi></msub></msub><mo>)</mo></mrow><mo>/</mo><mn>2</mn><mo>,</mo></mrow>]]></math><img file="FDA00011466148300000313.GIF" wi="1678" he="87" /></maths>则候选模式索引n增加1,继续执行步骤(6h),反之则结束,输出候选模式索引n;(6i)由候选模式索引n的候选模式为P<sub>1</sub>~P<sub>n</sub>,得到最终候选预测模式集合N={P<sub>1</sub>,P<sub>2</sub>,···,P<sub>n</sub>};(7)对预测单元PU,依次用步骤(6)得到的最终候选模式集合N中的n种候选模式进行率失真优化RDO过程,选取最小RDO代价函数值对应的候选模式作为最优预测模式;(8)对编码单元的其他预测单元重复步骤(2)~步骤(8),完成待处理视频的帧内图像的帧内预测模式选择。
地址 710071 陕西省西安市太白南路2号