发明名称 基于贪婪搜索的人脸画像合成方法
摘要 本发明公开了一种基于贪婪搜索的人脸画像合成方法。其实现步骤是:划分字典训练照片样本集A、合成训练照片样本集B<sub>p</sub>、合成训练画像样本集B<sub>s</sub>和测试照片样本集;通过分块得到字典训练照片块集合S<sub>A</sub>、合成训练照片块集合S<sub>p</sub>、合成训练画像块集合S<sub>s</sub>和测试照片块集合;从字典训练照片块集合S<sub>A</sub>中学到训练照片块特征字典D<sub>p</sub>;用D<sub>p</sub>求出S<sub>p</sub>对应的稀疏表示集合C<sub>p</sub>以及测试照片块S对应的稀疏表示;用稀疏表示在C<sub>p</sub>中进行贪婪搜索寻找近邻;再用搜索到的近邻画像-照片块来建立马尔可夫随机场模型合成画像。本发明与现有方法相比,无需限制测试照片背景,且能合成测试照片中的非人脸部件,可用于刑侦破案和数字娱乐。
申请公布号 CN104517274A 申请公布日期 2015.04.15
申请号 CN201410818175.3 申请日期 2014.12.25
申请人 西安电子科技大学 发明人 高新波;张声传;王楠楠;李洁;张铭津;胡彦婷;彭春蕾;任文君
分类号 G06T5/50(2006.01)I;G06K9/62(2006.01)I 主分类号 G06T5/50(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱卫星
主权项 一种基于贪婪搜索的人脸画像合成方法,包括如下步骤:(1)将画像‑照片对集合中的图像由彩色图像变成灰度图像,再将灰度图像划分为字典训练照片样本集A、合成训练照片样本集B<sub>p</sub>、合成训练画像样本集B<sub>s</sub>和测试照片样本集,并从测试照片样本集中选取一张测试照片P;(2)将字典训练照片样本集A中的照片划分为相同大小及相同重叠程度的块,得到字典训练照片块集合S<sub>A</sub>,对字典训练照片块集合S<sub>A</sub>利用有效稀疏编码方法得到训练照片块特征字典D<sub>p</sub>;(3)获取合成训练照片块集合S<sub>p</sub>对应的稀疏表示集合C<sub>p</sub>:(3a)将合成训练照片样本集B<sub>p</sub>中的照片划分为相同大小及相同重叠程度的合成训练照片块集合:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>S</mi><mi>p</mi></msub><mo>=</mo><mrow><mo>(</mo><mo>{</mo><msubsup><mi>x</mi><mn>1</mn><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>x</mi><mn>1</mn><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>x</mi><mn>1</mn><mi>N</mi></msubsup><mo>}</mo><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mo>{</mo><msubsup><mi>x</mi><mi>i</mi><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>x</mi><mi>i</mi><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>x</mi><mi>i</mi><mi>N</mi></msubsup><mo>}</mo><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mo>{</mo><msubsup><mi>x</mi><mi>M</mi><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>x</mi><mi>M</mi><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>x</mi><mi>M</mi><mi>N</mi></msubsup><mo>}</mo><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000643136420000011.GIF" wi="1456" he="107" /></maths>其中,<img file="FDA0000643136420000014.GIF" wi="49" he="63" />表示第i张照片中的第j个照片块,i∈1,…,M,M为合成训练照片样本集B<sub>p</sub>中照片的总个数,j∈1,…,N,N为每张照片被划分的块的总个数;(3b)将合成训练画像样本集B<sub>s</sub>中的画像以上述相同的方式划分得到对应的合成训练画像块集合:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>S</mi><mi>s</mi></msub><mo>=</mo><mrow><mo>(</mo><mo>{</mo><msubsup><mi>y</mi><mn>1</mn><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>y</mi><mn>1</mn><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>y</mi><mn>1</mn><mi>N</mi></msubsup><mo>}</mo><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mo>{</mo><msubsup><mi>y</mi><mi>i</mi><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>y</mi><mi>i</mi><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>y</mi><mi>i</mi><mi>N</mi></msubsup><mo>}</mo><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mo>{</mo><msubsup><mi>y</mi><mi>M</mi><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>y</mi><mi>M</mi><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>y</mi><mi>M</mi><mi>N</mi></msubsup><mo>}</mo><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000643136420000012.GIF" wi="1464" he="104" /></maths>其中,<img file="FDA0000643136420000015.GIF" wi="53" he="63" />表示第i张画像中的第j个画像块,i∈1,…,M,M为合成训练画像样本集B<sub>s</sub>中画像的总个数,j∈1,…,N,N为每张画像被划分的块的总个数;(3c)用训练照片块特征字典D<sub>p</sub>对合成训练照片块集合S<sub>p</sub>进行稀疏编码,得到合成训练照片块集合S<sub>p</sub>对应的稀疏表示集合:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>C</mi><mi>p</mi></msub><mo>=</mo><mrow><mo>(</mo><mo>{</mo><msubsup><mi>c</mi><mn>1</mn><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>c</mi><mn>1</mn><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>c</mi><mn>1</mn><mi>N</mi></msubsup><mo>}</mo><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mo>{</mo><msubsup><mi>c</mi><mi>i</mi><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>c</mi><mi>i</mi><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>c</mi><mi>i</mi><mi>N</mi></msubsup><mo>}</mo><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mo>{</mo><msubsup><mi>c</mi><mi>M</mi><mn>1</mn></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>c</mi><mi>M</mi><mi>j</mi></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>c</mi><mi>M</mi><mi>N</mi></msubsup><mo>}</mo><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000643136420000013.GIF" wi="1430" he="106" /></maths>其中,<img file="FDA0000643136420000024.GIF" wi="48" he="63" />表示第i张照片中的第j个照片块<img file="FDA0000643136420000025.GIF" wi="48" he="63" />的稀疏表示,由于每个稀疏表示<img file="FDA0000643136420000026.GIF" wi="47" he="63" />都包含稀疏系数值<img file="FDA0000643136420000027.GIF" wi="48" he="63" />以及稀疏系数值在稀疏编码中被求解的顺序<img file="FDA0000643136420000028.GIF" wi="76" he="73" />因此稀疏表示集合C<sub>p</sub>包含有稀疏系数值集合V<sub>p</sub>以及对应的稀疏系数值在稀疏编码中被求解的顺序集合O<sub>p</sub>;(4)获取测试照片块x<sup>j</sup>对应的稀疏表示c<sup>j</sup>:(4a)将测试照片P划分为相同大小及相同重叠程度的测试照片块集合:S={x<sup>1</sup>,…,x<sup>j</sup>,…,x<sup>N</sup>},x<sup>j</sup>表示测试照片P中的第j个照片块;(4b)将每个测试照片块x<sup>j</sup>用训练照片块特征字典D<sub>p</sub>进行稀疏编码,得到x<sup>j</sup>对应的稀疏表示c<sup>j</sup>;其中,c<sup>j</sup>表示第j个测试照片块x<sup>j</sup>的稀疏表示,每个稀疏表示c<sup>j</sup>都包含稀疏系数值v<sup>j</sup>以及稀疏系数值在稀疏编码中被求解的顺序o<sup>j</sup>;(5)对合成训练画像块集合S<sub>s</sub>利用贪婪搜索获取每个测试照片块x<sup>j</sup>对应的待选择画像块集合:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msup><mover><mi>y</mi><mo>~</mo></mover><mi>j</mi></msup><mo>=</mo><mo>{</mo><msup><mi>y</mi><mrow><mi>j</mi><mo>,</mo><mn>1</mn></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mi>j</mi><mo>,</mo><mn>2</mn></mrow></msup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msup><mi>y</mi><mrow><mi>j</mi><mo>,</mo><mi>K</mi></mrow></msup><mo>}</mo><mo>;</mo></mrow>]]></math><img file="FDA0000643136420000021.GIF" wi="511" he="95" /></maths>(6)利用步骤(5)得到的待选择画像块集合<img file="FDA0000643136420000022.GIF" wi="88" he="75" />通过求解马尔可夫随机场模型来得到每个测试照片块x<sup>j</sup>最终对应的训练画像块,并将这些训练画像块进行组合得到与测试照片P对应的合成画像。
地址 710071 陕西省西安市太白南路2号