发明名称 一种基于非线性预测稀疏编码的单幅图像超分辨率快速重建方法
摘要 本发明公开了一种基于非线性预测稀疏编码的图像超分辨率重建方法,在训练过程中,本发明在经典的基于稀疏编码算法的准则函数基础上叠加了非线性预测编码项,并且设计了自己的优化策略来最小化该目标函数,在重建过程中,本发明仅仅对输入的低分辨率图像块和预先训练得到的低分辨率字典采用一个非线性迭代步骤直接来逼近所要求的稀疏编码,避免了对每一个小图像块求解稀疏表示系数的问题。实验结果表明,与经典的基于稀疏编码的图像超分辨率算法相比,本发明在保证了重建结果具有充分竞争力的同时大大降低了实验所需的时间。
申请公布号 CN105976410A 申请公布日期 2016.09.28
申请号 CN201610292197.X 申请日期 2016.05.05
申请人 南京信息工程大学 发明人 沈辉;袁晓彤
分类号 G06T9/00(2006.01)I;G06T3/40(2006.01)I 主分类号 G06T9/00(2006.01)I
代理机构 江苏爱信律师事务所 32241 代理人 唐小红
主权项 一种基于非线性预测稀疏编码的图像超分辨率重建方法,其特征在于:重建阶段不需要对每个图像块求解一个稀疏表示问题,而仅仅采用输入的低分辨率图像块和预先训练得到低分辨率字典直接预测出稀疏编码,采用如下步骤:1)如下给定采样的训练块对{X<sub>h</sub>,X<sub>l</sub>},这里X<sub>h</sub>是高分辨率图像块,X<sub>l</sub>是经过对应的高分辨率图像块下采样得到的低分辨率图像块。本文考虑如下准则函数:<maths num="0001"><math><![CDATA[<mrow><mtable><mtr><mtd><mrow><mi>min</mi><mi> </mi><mi>f</mi><mrow><mo>(</mo><msub><mi>D</mi><mi>h</mi></msub><mo>,</mo><msub><mi>D</mi><mi>l</mi></msub><mo>,</mo><mi>A</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mtable><mtr><mtd><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo></mrow></mtd><mtd><mrow><mo>|</mo><mo>|</mo><msub><mi>D</mi><mrow><mi>h</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>&le;</mo><mn>1</mn><mo>,</mo><mo>|</mo><mo>|</mo><msub><mi>D</mi><mrow><mi>l</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>&le;</mo><mn>1</mn></mrow></mtd></mtr></mtable></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000981847850000011.GIF" wi="1254" he="135" /></maths>上式中,i表示字典的第i列,A代码稀疏编码;其中:<maths num="0002"><math><![CDATA[<mrow><mtable><mtr><mtd><mrow><mi>f</mi><mrow><mo>(</mo><msub><mi>D</mi><mi>h</mi></msub><mo>,</mo><msub><mi>D</mi><mi>l</mi></msub><mo>,</mo><mi>A</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>|</mo><mo>|</mo><msub><mi>X</mi><mi>h</mi></msub><mo>-</mo><msub><mi>D</mi><mi>h</mi></msub><mi>A</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>|</mo><mo>|</mo><mi>tanh</mi><mrow><mo>(</mo><msub><mi>WX</mi><mi>h</mi></msub><mo>+</mo><mi>B</mi><mo>)</mo></mrow><mo>-</mo><mi>A</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup></mrow></mtd></mtr><mtr><mtd><mrow><mo>+</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><mo>|</mo><mo>|</mo><msub><mi>X</mi><mi>l</mi></msub><mo>-</mo><msub><mi>D</mi><mi>l</mi></msub><mi>A</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><mo>|</mo><mo>|</mo><mi>tanh</mi><mrow><mo>(</mo><mrow><msub><mi>WX</mi><mi>l</mi></msub><mo>+</mo><mi>B</mi></mrow><mo>)</mo></mrow><mo>-</mo><mi>A</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>&lambda;</mi><mrow><mo>(</mo><mrow><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>+</mo><mfrac><mn>1</mn><mi>M</mi></mfrac></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mi>A</mi><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub></mrow></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000981847850000012.GIF" wi="1709" he="215" /></maths>上式中,N和M分别是高、低分辨率图像块以列向量形式表达的维数,W、B是非线性预测模型的参数;2)优化如下问题:<maths num="0003"><math><![CDATA[<mrow><mtable><mtr><mtd><mrow><munder><mi>min</mi><mrow><mo>{</mo><mrow><msub><mi>D</mi><mi>h</mi></msub><mo>,</mo><msub><mi>D</mi><mi>l</mi></msub><mo>,</mo><mi>A</mi><mo>,</mo><mi>W</mi><mo>,</mo><mi>B</mi></mrow><mo>}</mo></mrow></munder><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>|</mo><mo>|</mo><msub><mi>X</mi><mi>h</mi></msub><mo>-</mo><msub><mi>D</mi><mi>h</mi></msub><mi>A</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>|</mo><mo>|</mo><mi>tanh</mi><mrow><mo>(</mo><mrow><msub><mi>WX</mi><mi>h</mi></msub><mo>+</mo><mi>B</mi></mrow><mo>)</mo></mrow><mo>-</mo><mi>A</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><mo>|</mo><mo>|</mo><msub><mi>X</mi><mi>l</mi></msub><mo>-</mo><msub><mi>D</mi><mi>l</mi></msub><mi>A</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><mo>|</mo><mo>|</mo><mi>tanh</mi><mrow><mo>(</mo><mrow><msub><mi>WX</mi><mi>l</mi></msub><mo>+</mo><mi>B</mi></mrow><mo>)</mo></mrow><mo>-</mo><mi>A</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>&lambda;</mi><mrow><mo>(</mo><mrow><mfrac><mn>1</mn><mi>N</mi></mfrac><mo>+</mo><mfrac><mn>1</mn><mi>M</mi></mfrac></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mi>A</mi><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub></mrow></mtd></mtr><mtr><mtd><mtable><mtr><mtd><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo></mrow></mtd><mtd><mrow><mo>|</mo><mo>|</mo><msub><mi>D</mi><mrow><mi>h</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>&le;</mo><mn>1</mn><mo>,</mo><mo>|</mo><mo>|</mo><msub><mi>D</mi><mrow><mi>l</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>&le;</mo><mn>1</mn></mrow></mtd></mtr></mtable></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000981847850000013.GIF" wi="1798" he="174" /></maths>整个优化过程如下:2‑1)令t=0,采用高斯随机矩阵对字典D<sub>l</sub>和D<sub>h</sub>初始化处理,并且将字典的每一个列都作单位归一化,随机初始化W和B;2‑2)固定<img file="FDA0000981847850000014.GIF" wi="481" he="62" />采用ADMM方法,更新A<sup>(t)</sup>:<maths num="0004"><math><![CDATA[<mrow><msup><mi>A</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>=</mo><munder><mi>argmin</mi><mi>A</mi></munder><mi>f</mi><mrow><mo>(</mo><msup><mi>B</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>,</mo><msup><mi>W</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>,</mo><msubsup><mi>D</mi><mi>h</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>D</mi><mi>l</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>,</mo><mi>A</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000981847850000015.GIF" wi="638" he="78" /></maths>2‑3)固定<img file="FDA0000981847850000016.GIF" wi="203" he="71" />和A<sup>(t)</sup>采用梯度下降法,更新W和B:<maths num="0005"><math><![CDATA[<mrow><msup><mi>W</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>,</mo><msup><mi>B</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>=</mo><munder><mi>argmin</mi><mrow><mi>W</mi><mo>,</mo><mi>B</mi></mrow></munder><mi>f</mi><mrow><mo>(</mo><msubsup><mi>D</mi><mi>h</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>D</mi><mi>l</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msup><mi>A</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>,</mo><msup><mi>W</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>,</mo><msup><mi>B</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000981847850000017.GIF" wi="877" he="93" /></maths>2‑4)固定A<sup>(t)</sup>,W<sup>(t)</sup>,B<sup>(t)</sup>,更新<img file="FDA0000981847850000018.GIF" wi="96" he="61" />和<img file="FDA0000981847850000019.GIF" wi="123" he="63" /><maths num="0006"><math><![CDATA[<mfenced open = "" close = ""><mtable><mtr><mtd><mrow><msubsup><mi>D</mi><mi>h</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>D</mi><mi>l</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><munder><mi>argmin</mi><mrow><msub><mi>D</mi><mi>h</mi></msub><mo>,</mo><msub><mi>D</mi><mi>l</mi></msub></mrow></munder><mi>f</mi><mrow><mo>(</mo><msup><mi>A</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>,</mo><msup><mi>W</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>,</mo><msup><mi>B</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>,</mo><msubsup><mi>D</mi><mi>h</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>D</mi><mi>l</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mtable><mtr><mtd><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo></mrow></mtd><mtd><mrow><mo>|</mo><mo>|</mo><msub><mi>D</mi><mrow><mi>h</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>&le;</mo><mn>1</mn><mo>,</mo><mo>|</mo><mo>|</mo><msub><mi>D</mi><mrow><mi>l</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>&le;</mo><mn>1</mn></mrow></mtd></mtr></mtable></mtd></mtr></mtable></mfenced>]]></math><img file="FDA00009818478500000110.GIF" wi="942" he="198" /></maths>这一步利用联合字典训练思路进行优化;2‑5)令t:=t+1,迭代2‑2)到2‑4),直到收敛;3)利用非线性预测稀疏编码进行图像超分辨率重建时,在重建阶段不必再为每一个图像块求解一个稀疏表示问题,设输入的图像为Y,每个输入的图像块为y,每个图像块的稀疏编码可以进行如下逼近:A=tanh(Wy+B)   (4)高分辨率块重建表达式如下:x<sub>h</sub>=D<sub>h</sub>A=D<sub>h</sub>(tanh(Wy+B))   (5)下面给出了非线性预测稀疏编码的超分辨率流程;步骤3)中基于非线性预测稀疏编码的图像超分辨率算法:3‑1)输入:预训练得到的字典D<sub>h</sub>和D<sub>l</sub>,一幅低分辨率图像Y,参数W和B;3‑2)For对于Y中的每个5*5小块y,从左到右,从上到下,在每个方向上保证4;个像素重叠:①计算每个块中的平均像素值m,每个块的像素值减去均值;②计算高分辨率块x<sub>h</sub>=D<sub>h</sub>(tanh(Wy+B));③计算x<sub>h</sub>+m,填入高分辨率图像X<sub>0</sub>;End3‑3)在解空间中,找到与X<sub>0</sub>最匹配的图像:<maths num="0007"><math><![CDATA[<mrow><msup><mi>X</mi><mo>*</mo></msup><mo>=</mo><munder><mi>argmin</mi><mi>X</mi></munder><mo>|</mo><mo>|</mo><mi>S</mi><mi>H</mi><mi>X</mi><mo>-</mo><mi>Y</mi><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>c</mi><mo>|</mo><mo>|</mo><mi>X</mi><mo>-</mo><msub><mi>X</mi><mn>0</mn></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup></mrow>]]></math><img file="FDA0000981847850000021.GIF" wi="637" he="86" /></maths>H是一个模糊算子,S是一个下采样算子,c是平衡参数;3‑4)输出:超分辨率图像X<sup>*</sup>。
地址 210044 江苏省南京市建邺区奥体大街69号