发明名称 插值依赖的图像自适应下采样方法
摘要 插值依赖的图像自适应下采样方法,涉及图像及视频处理,解决了目前的下采样与上采样往往是独立的,而图像及视频的处理通常同时需要下采样和上采样的问题,它包括具体步骤如下:步骤一、对给定的输入图像,生成一幅下采样图像,对此下采样图像插值出上采样图像;步骤二、采用基于块的下采样方法,提高下采样图像的质量;步骤三、判断与内容是否无关;是,执行步骤四;否,执行步骤五;步骤四、与内容无关的下采样,插值系数组成插值矩阵,对插值过程求逆得到下采样图像;步骤五、与内容相关,给出初始系数,运用与内容无关的方法得到一幅初始的下采样图像,根据得到的图像训练出新的插值系数,然后再迭代得到下采样图像。用于图像及视频处理。
申请公布号 CN102769745B 申请公布日期 2014.12.31
申请号 CN201210206705.X 申请日期 2012.06.21
申请人 哈尔滨工业大学 发明人 张永兵;赵德斌;高文
分类号 H04N19/59(2014.01)I 主分类号 H04N19/59(2014.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 牟永林
主权项 插值依赖的图像自适应下采样方法,其特征是,它包括具体步骤如下:步骤一、对给定的插值方法和输入图像,生成一幅下采样图像,对此下采样图像插值出高质量的上采样图像,具体步骤为:令Y表示大小为M×N的输入图像,X表示大小为M/2×N/2的下采样后的图像,<img file="FDA0000561059680000011.GIF" wi="58" he="70" />表示经插值后生成的上采样图像,X要满足:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>X</mi><mo>=</mo><mi>arg</mi><munder><mi>min</mi><mi>x</mi></munder><msup><mrow><mo>|</mo><mo>|</mo><mover><mi>Y</mi><mo>^</mo></mover><mo>-</mo><mi>Y</mi><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000561059680000012.GIF" wi="1029" he="132" /></maths>其中,X=[X<sub>0,0</sub>,X<sub>0,1</sub>,...,X<sub>0,N2‑1</sub>,X<sub>1,0</sub>,X<sub>1,1</sub>,...,X<sub>1,N/2‑1</sub>,...,X<sub>M/2‑1,0</sub>,X<sub>M/2‑1,1</sub>,...,X<sub>M/2‑1,N/2‑1</sub>]<sup>T</sup>,并且Y=[Y<sub>0,0</sub>,Y<sub>0,1</sub>,...,Y<sub>0,N‑1</sub>,Y<sub>1,0</sub>,Y<sub>1,1</sub>,...,Y<sub>1,N‑1</sub>,...,Y<sub>M/2‑1,0</sub>,Y<sub>M‑1,1</sub>,...,Y<sub>M‑1,N‑1</sub>]<sup>T</sup>,Y的插值为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><mi>Y</mi><mo>^</mo></mover><mo>=</mo><mi>HX</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000561059680000013.GIF" wi="868" he="70" /></maths>其中,H为插值矩阵;由插值系数组成的H被表示为:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>H</mi><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>h</mi><mn>0,0</mn></msub></mtd><mtd><msub><mi>h</mi><mn>0,1</mn></msub></mtd><mtd><mo>.</mo><mo>.</mo></mtd><mtd><msub><mi>h</mi><mrow><mn>0</mn><mo>,</mo><mi>M</mi><mo>/</mo><mn>2</mn><mo>&times;</mo><mi>N</mi><mo>/</mo><mn>2</mn><mo>-</mo><mn>1</mn></mrow></msub></mtd></mtr><mtr><mtd><msub><mi>h</mi><mn>1,0</mn></msub></mtd><mtd><msub><mi>h</mi><mn>1,1</mn></msub></mtd><mtd><mo>.</mo><mo>.</mo></mtd><mtd><msub><mi>h</mi><mrow><mn>1</mn><mo>,</mo><mi>M</mi><mo>/</mo><mn>2</mn><mo>&times;</mo><mi>N</mi><mo>/</mo><mn>2</mn><mo>-</mo><mn>1</mn></mrow></msub></mtd></mtr><mtr><mtd><msub><mi>h</mi><mn>2,0</mn></msub></mtd><mtd><msub><mi>h</mi><mn>2,1</mn></msub></mtd><mtd><mo>.</mo><mo>.</mo></mtd><mtd><msub><mi>h</mi><mrow><mn>2</mn><mo>,</mo><mi>M</mi><mo>/</mo><mn>2</mn><mo>&times;</mo><mi>N</mi><mo>/</mo><mn>2</mn><mo>-</mo><mn>1</mn></mrow></msub></mtd></mtr><mtr><mtd><mo>.</mo><mo>.</mo></mtd><mtd><mo>.</mo><mo>.</mo></mtd><mtd><mo>.</mo><mo>.</mo></mtd><mtd><mo>.</mo><mo>.</mo></mtd></mtr><mtr><mtd><msub><mi>h</mi><mrow><mi>M</mi><mo>&times;</mo><mi>N</mi><mo>-</mo><mn>1,0</mn></mrow></msub></mtd><mtd><msub><mi>h</mi><mrow><mi>M</mi><mo>&times;</mo><mi>N</mi><mo>-</mo><mn>1,1</mn></mrow></msub></mtd><mtd><mo>.</mo><mo>.</mo></mtd><mtd><msub><mi>h</mi><mrow><mi>M</mi><mo>&times;</mo><mi>N</mi><mo>-</mo><mn>1</mn><mo>,</mo><mi>M</mi><mo>/</mo><mn>2</mn><mo>&times;</mo><mi>N</mi><mo>/</mo><mn>2</mn><mo>-</mo><mn>1</mn></mrow></msub></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000561059680000014.GIF" wi="1287" he="388" /></maths>其中,h<sub>k,l</sub>表示插值第k个像素时第l个下采样像素所对应的插值系数;将公式(3)和公式(2)带入公式(1),得到最优下采样图像的目标函数为:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>J</mi><mo>=</mo><mi>arg</mi><munder><mi>min</mi><mi>x</mi></munder><msup><mrow><mo>|</mo><mo>|</mo><mi>HX</mi><mo>-</mo><mi>Y</mi><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000561059680000015.GIF" wi="1073" he="102" /></maths>令J的偏导为零,得到:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mfrac><mrow><mo>&PartialD;</mo><mi>J</mi></mrow><mrow><mo>&PartialD;</mo><mi>X</mi></mrow></mfrac><mo>=</mo><msup><mi>H</mi><mi>T</mi></msup><mrow><mo>(</mo><mi>HX</mi><mo>-</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mn>0</mn><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000561059680000016.GIF" wi="1066" he="128" /></maths>则最优的下采样图像通过下式得到:X<sup>*</sup>=(H<sup>T</sup>H)<sup>‑1</sup>H<sup>T</sup>Y      (6);步骤二、对步骤一得到的上采样图像,采用基于块的图像自适应下采样方法,利用与当前块相关的信息并将其与对应的插值系数的乘积的累加和作为一个常数向量来提高下采样图像的质量,具体步骤为:以m×n大小的块和双线性插值来描述块级的插值依赖的图像自适应下采样方法,定义Φ为一个常数向量,则对Y的插值被表示:<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><mover><mi>Y</mi><mo>^</mo></mover><mo>=</mo><mi>HX</mi><mo>+</mo><mi>&Phi;</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000561059680000017.GIF" wi="911" he="76" /></maths>其中Φ为一个长度为mn的列向量,Φ中的绝大部分元素都为零,只对与边界像素相对应的元素赋予恰当的值,对插值矩阵H和与其对应的列向量Φ的赋值为:插值矩阵H的计算:输入图像Y和当前块B;当i行对应的像素∈B,j列对应的像素∈B<sub>L</sub>时;插值矩阵H中行列位置为(i,j)的元素为H<sub>ij</sub>;将与当前块B维数对应的插值矩阵元素H<sub>ij</sub>初始化为0;如果j列所对应像素包含在i行所对应像素的邻域范围N(i)之内;则将该行列位置(i,j)的矩阵元素H<sub>ij</sub>赋值为该列数对应的插值系数W<sub>j</sub>;输出插值矩阵H;常数向量Φ的计算:输入图像Y和当前块B;当i行对应的像素∈B;将当前块B内位置i对应的常数向量元素Φ<sub>i</sub>初始化为0;将变量sum初始化为0;对于j列所对应像素包含在i行所对应像素的邻域范围N(i)之内;如果j列所对应像素不包含在当前块B内,将第j列像素与第j列像素对应插值系数的乘积累加到变量sum;将变量sum累加到常数向量元素Φ<sub>i</sub>;输出常数向量Φ;其中B<sub>L</sub>表示与当前块B对应的下采样块,N(i)表示插值第i个像素涉及到的邻域像素;将公式(7)带入公式(4),计算最优下采样块的目标函数表示为:<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><mi>J</mi><mo>=</mo><mi>arg</mi><munder><mi>min</mi><mi>x</mi></munder><msup><mrow><mo>|</mo><mo>|</mo><mi>HX</mi><mo>+</mo><mi>&Phi;</mi><mo>-</mo><mi>Y</mi><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000561059680000021.GIF" wi="1128" he="102" /></maths>将公式(8)中J的偏导设为零,得到:<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><mfrac><mrow><mo>&PartialD;</mo><mi>J</mi></mrow><mrow><mo>&PartialD;</mo><mi>X</mi></mrow></mfrac><mo>=</mo><msup><mi>H</mi><mi>T</mi></msup><mrow><mo>(</mo><mi>HX</mi><mo>+</mo><mi>&Phi;</mi><mo>-</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mn>0</mn><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000561059680000022.GIF" wi="1146" he="129" /></maths>最优下采样块由下式得到:X<sup>*</sup>=(H<sup>T</sup>H)<sup>‑1</sup>[H<sup>T</sup>Y‑H<sup>T</sup>Φ]     (10);步骤三、判断是否为与内容无关的插值;是,则执行步骤四;否,则执行步骤五;步骤四、与内容无关的插值依赖的图像自适应下采样方法,将插值系数组合成插值矩阵,通过对插值过程求其对应的逆操作来得到对应的最优的下采样图像;步骤五、与内容相关的插值依赖的图像自适应下采样方法,首先给出一组初始的插值系数,运用与内容无关的插值依赖的图像下采样方法得到一幅初始的下采样图像,根据得到的下采样图像训练出新的插值系数,然后再迭代得到下采样图像。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号