发明名称 一种基于图像位置块近邻嵌入的人脸幻构方法
摘要 本发明提供一种基于图像位置块近邻嵌入的人脸幻构方法,对输入的低分辨率人脸图像、低分辨率训练集中的低分辨率人脸样本图像以及高分辨率训练集中的高分辨率人脸样本图像划分相互重叠的图像块,建立低、高分辨率人脸样本块空间;对于输入的低分辨率人脸图像中每个图像块,寻找对应位置的低分辨率图像块字典中距离该小图像块距离最近的K个图像块,然后为这K个图像块在高分辨率图像块字典中找到对应K个近邻高分辨率图像块;用这K个低分辨率图像块线性表示输入低分辨率图像块获得表示系数;利用此表示系数和K个近邻高分辨率图像块重建出新的高分辨率图像块;根据低分辨率图像块的位置关系将所得的高分辨率图像块融合成高分辨率图像。
申请公布号 CN106157274A 申请公布日期 2016.11.23
申请号 CN201510151884.5 申请日期 2015.04.01
申请人 武汉大学 发明人 胡瑞敏;渠慎明;王中元;江俊君;张茂胜;廖良;关健;刘波
分类号 G06T5/50(2006.01)I 主分类号 G06T5/50(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 严彦
主权项 一种基于图像位置块近邻嵌入的人脸幻构方法,其特征在于,包括如下步骤:步骤1,对输入的低分辨率人脸图像、低分辨率训练集中的低分辨率人脸样本图像以及高分辨率训练集中的高分辨率人脸样本图像划分相互重叠的图像块;步骤2,对于输入的低分辨率人脸图像中每个图像块,取低分辨率训练集中每个低分辨率人脸样本图像相应位置的图像块作为样本点,得到低分辨率图像块字典,建立低分辨率人脸样本块空间,得到取高分辨率训练集中每个高分辨率人脸样本图像相应位置的图像块作为样本点,得到高分辨率图像块字典,建立高分辨率人脸样本块空间;实现如下,设对输入的低分辨率人脸图像X<sup>t</sup>划分为M个相互重叠的图像块后所构成的图像块集为{x<sup>t</sup><sub>j</sub>|1≤j≤M},对高、低分辨率人脸图像训练集分别划分相互重叠的图像块,然后分别得到M个与输入的低分辨率人脸图像M个图像块对应位置的高分辨率图像块字典<img file="FDA0000692651790000011.GIF" wi="238" he="122" />和低分辨率图像块字典<img file="FDA0000692651790000012.GIF" wi="270" he="122" />其中,标识i表示高分辨率训练集中高分辨率人脸样本图像的序号和低分辨率训练集中低分辨率人脸样本图像的序号,标识j表示图像上的块位置序号,<img file="FDA0000692651790000013.GIF" wi="54" he="74" />为低分辨率训练集中低分辨率人脸样本图像的个数和高分辨率训练集中高分辨率人脸样本图像的个数,M为每幅图像划分图像块的块数;步骤3,对输入低分辨率人脸图像中每一个图像块,分别采用以下步骤计算对应的目标高分辨率人脸图像块,步骤3.1,对于输入低分辨率人脸图像中某一个图像块x<sup>t</sup><sub>j</sub>,计算与对应位置的低分辨率图像块字典<img file="FDA0000692651790000015.GIF" wi="250" he="119" />中各低分辨率图像块<img file="FDA0000692651790000016.GIF" wi="57" he="83" />的距离,并寻找其中距离最小的K个低分辨率图像块,K是选定的近邻个数,计算如下,<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>dist</mi><mi>i</mi></msub><mo>=</mo><msub><mrow><mo>|</mo><mo>|</mo><mover><msub><mi>x</mi><mi>i</mi></msub><mo>&OverBar;</mo></mover><mo>-</mo><msub><msup><mi>x</mi><mi>t</mi></msup><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mover><mi>N</mi><mo>&OverBar;</mo></mover><mo>.</mo><mo>,</mo></mrow>]]></math><img file="FDA0000692651790000017.GIF" wi="591" he="109" /></maths>N<sub>K</sub>(x<sup>t</sup><sub>j</sub>)=support(dist|<sub>K</sub>),其中,dist<sub>i</sub>表示x<sup>t</sup><sub>j</sub>与低分辨率图像块字典中图像块<img file="FDA0000692651790000018.GIF" wi="61" he="88" />的距离,dist|<sub>K</sub>表示dist中最小的K个值,||·||<sub>2</sub>表示二范数,N<sub>K</sub>(x<sup>t</sup><sub>j</sub>)是x<sup>t</sup><sub>j</sub>与低分辨率图像块字典中各图像块<img file="FDA0000692651790000019.GIF" wi="56" he="91" />的距离最小的K个图像块索引的集合;步骤3.2,利用K个低分辨率图像块对输入低分辨率图像块进行线性重构,求取线性重构的权重系数,得到最佳重建权重<img file="FDA0000692651790000021.GIF" wi="79" he="65" />求取方式如下:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><mi>w</mi><mo>^</mo></mover><mo>=</mo><munder><mrow><mi>arg</mi><mi>min</mi></mrow><mi>w</mi></munder><mo>{</mo><msubsup><mrow><mo>|</mo><mo>|</mo><msub><msup><mi>x</mi><mi>t</mi></msup><mi>j</mi></msub><mo>-</mo><munder><mi>&Sigma;</mi><mrow><mi>k</mi><mo>&Element;</mo><msub><mi>N</mi><mi>K</mi></msub><mrow><mo>(</mo><msub><msup><mi>x</mi><mi>t</mi></msup><mi>j</mi></msub><mo>)</mo></mrow></mrow></munder><msub><mi>w</mi><mi>k</mi></msub><msub><mover><mi>x</mi><mo>&OverBar;</mo></mover><mi>k</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>&tau;</mi><munder><mi>&Sigma;</mi><mrow><mi>k</mi><mo>&Element;</mo><msub><mi>N</mi><mi>K</mi></msub><mrow><mo>(</mo><msub><msup><mi>x</mi><mi>t</mi></msup><mi>j</mi></msub><mo>)</mo></mrow></mrow></munder><msubsup><mrow><mo>|</mo><mo>|</mo><msub><mi>w</mi><mi>k</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>}</mo></mrow>]]></math><img file="FDA0000692651790000022.GIF" wi="1021" he="212" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mfenced open='' close=''><mtable><mtr><mtd><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo></mtd><mtd><msub><mi>&Sigma;</mi><mrow><mi>k</mi><mo>&Element;</mo><msub><mi>N</mi><mi>K</mi></msub><mrow><mo>(</mo><msub><msup><mi>x</mi><mi>t</mi></msup><mi>j</mi></msub><mo>)</mo></mrow></mrow></msub><msub><mi>w</mi><mi>k</mi></msub><mo>=</mo><mn>1</mn></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000692651790000023.GIF" wi="517" he="94" /></maths>其中,<img file="FDA0000692651790000024.GIF" wi="54" he="74" />为低分辨率图像块字典中第k个图像块,k为索引集合N<sub>K</sub>(x<sup>t</sup><sub>j</sub>)中的元素,w<sub>k</sub>为图像块<img file="FDA0000692651790000025.GIF" wi="62" he="79" />的权重系数,<img file="FDA0000692651790000026.GIF" wi="227" he="100" />返回关于变量w的函数在得到最小值时w的取值,<img file="FDA0000692651790000027.GIF" wi="109" he="82" />表示对二范数||·||<sub>2</sub>的结果求平方,τ是正则化参数;步骤3.3,在得到最佳重建权重<img file="FDA0000692651790000028.GIF" wi="48" he="65" />后,通过下式来重建新的高分辨率图像块y<sup>t</sup><sub>j</sub>,<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><msup><mi>y</mi><mi>t</mi></msup><mi>j</mi></msub><mo>=</mo><munder><mi>&Sigma;</mi><mrow><mi>k</mi><mo>&Element;</mo><msub><mi>N</mi><mi>K</mi></msub><mrow><mo>(</mo><msub><msup><mi>x</mi><mi>t</mi></msup><mi>j</mi></msub><mo>)</mo></mrow></mrow></munder><msub><mover><mi>w</mi><mo>^</mo></mover><mi>k</mi></msub><msub><mover><mi>y</mi><mo>&OverBar;</mo></mover><mi>k</mi></msub></mrow>]]></math><img file="FDA0000692651790000029.GIF" wi="357" he="133" /></maths>其中,<img file="FDA00006926517900000210.GIF" wi="68" he="85" />为高分辨率图像块字典中第k个图像块,k为索引集合N<sub>K</sub>(x<sup>t</sup><sub>j</sub>)中的元素,<img file="FDA00006926517900000211.GIF" wi="116" he="101" />代表括号内元素求和;步骤4,将所有加权重构出的高分辨率人脸图像块按照在人脸上的位置叠加,然后除以每个像素位置交叠的次数,得到一张高分辨率人脸图像。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学