发明名称 一种具有尺度无关特性的快速多模态图像协同分割方法
摘要 本发明公开了一种具有尺度无关特性的快速多模态图像协同分割方法,该方法包括:步骤一、打开输入的图像组文件,对当前输入图像组中图像利用SLIC算法依次提取个超像素,提取各张图像的超像素,计算所述超像素的颜色特征、区域协方差矩阵;进行图像的前景、背景区域初始化;步骤二、构建超像素多模态特征和前景区域、背景区域模型,步骤三、优化求解。本发明设计了简单实用的基于超像素的多模态特征融合与度量的方法,进一步将多模态特征引入图像协同分割的能量方程,能够在保证较高的正确率的同时,提高算法的运行速度。此外,由于多模态特征的引入,也极大地扩展了图像协同分割所能处理的场景,对复杂图像背景具有一定鲁棒性。
申请公布号 CN103093470A 申请公布日期 2013.05.08
申请号 CN201310024769.2 申请日期 2013.01.23
申请人 天津大学 发明人 冯伟;万亮;张加万;张士杰;江健民
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 李素兰
主权项 1.一种具有尺度无关特性的快速多模态图像协同分割方法,其特征在于,该方法具体包括以下步骤:步骤一、打开输入的图像组文件,对当前输入图像组中图像利用SLIC算法依次提取K个超像素,记为集合<maths num="0001"><![CDATA[<math><mrow><msup><mi>S</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>=</mo><mo>{</mo><msubsup><mi>S</mi><mn>1</mn><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mi>S</mi><mn>2</mn><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>S</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>S</mi><mi>k</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><mo>}</mo><mo>,</mo></mrow></math>]]></maths>其中,<img file="FDA00002767304200012.GIF" wi="70" he="59" />代表第t张图像的第i个超像素,K∈N,t=1,2,提取各张图像的超像素,计算所述超像素的颜色特征、区域协方差矩阵;进行图像的前景、背景区域初始化,具体处理为;对于一个给定的超像素<img file="FDA00002767304200013.GIF" wi="88" he="72" />计算其颜色特征<img file="FDA00002767304200014.GIF" wi="66" he="54" /><maths num="0002"><![CDATA[<math><mrow><msub><mover><mi>c</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><mo>=</mo><mfrac><mn>1</mn><mrow><mo>|</mo><msub><mi>S</mi><mi>p</mi></msub><mo>|</mo></mrow></mfrac><msub><mi>&Sigma;</mi><mrow><mi>j</mi><mo>&Element;</mo><msub><mi>S</mi><mi>p</mi></msub></mrow></msub><msub><mi>c</mi><mi>j</mi></msub><mo>,</mo></mrow></math>]]></maths>其中,S<sub>p</sub>为超像素p中所包含像素的集合,|S<sub>p</sub>|为超像素p中像素的个数,c<sub>i</sub>=[R<sub>j</sub>,G<sub>j</sub>,B<sub>j</sub>]<sup>T</sup>是像素j的RGB颜色值;对于一个给定的超像素集合<img file="FDA00002767304200016.GIF" wi="88" he="72" />计算其区域协方差矩阵V<sub>P</sub>,V<sub>p</sub>=(F<sub>p</sub>-μ(F<sub>p</sub>))<sup>T</sup>(F<sub>p</sub>-μ(F<sub>p</sub>)),其中,<img file="FDA00002767304200017.GIF" wi="452" he="73" />是超像素p的特征矩阵,f<sub>j,p</sub>=[x<sub>j</sub>,y<sub>j</sub>,R<sub>j</sub>,G<sub>j</sub>,B<sub>j</sub>]<sup>T</sup>为超像素p中第j个像素的特征向量,像素坐标为(x,y),μ(·)是特征矩阵的均值,T为向量的转置,采用PatchMatch算法,获得两幅图像中各自相应的前景区域<img file="FDA00002767304200018.GIF" wi="74" he="82" />和背景区域<img file="FDA00002767304200019.GIF" wi="91" he="82" />步骤二、在获得超像素的颜色特征、区域协方差矩阵的基础上,使用联合聚类方法构建超像素多模态特征和前景区域、背景区域模型,进一步使用BP算法完成图像协同分割;对于集合S<sup>(1)</sup>、S<sup>(2)</sup>使用非相似性度量D(p,q)进行联合聚类,形成C个簇,其中,<maths num="0003"><![CDATA[<math><mrow><mi>D</mi><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>)</mo></mrow><mo>=</mo><mo>:</mo><mi>&lambda;</mi><msub><mrow><mo>|</mo><mo>|</mo><mover><msub><mi>c</mi><mi>p</mi></msub><mo>&OverBar;</mo></mover><mo>-</mo><mover><msub><mi>c</mi><mi>q</mi></msub><mo>&OverBar;</mo></mover><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub><mo>+</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>&lambda;</mi><mo>)</mo></mrow><msup><mrow><mo>(</mo><msubsup><mi>&Sigma;</mi><mrow><mi>f</mi><mo>=</mo><mn>1</mn></mrow><mn>5</mn></msubsup><msup><mi>ln</mi><mn>2</mn></msup><msub><mi>&rho;</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>V</mi><mi>p</mi></msub><mo>,</mo><msub><mi>V</mi><mi>q</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mfrac><mn>1</mn><mn>2</mn></mfrac></msup><mo>,</mo></mrow></math>]]></maths>||·||<sub>2</sub>为欧式距离,ρ<sub>f</sub>(V<sub>p</sub>,V<sub>q</sub>)为区域协方差矩阵V<sub>p</sub>和V<sub>q</sub>第f个特征值,参数0≤λ≤1为权重系数,<img file="FDA000027673042000111.GIF" wi="146" he="79" />分别代表超像素p,q的颜色均值;以C个簇的中心作为一个字典γ={C<sub>1</sub>,…,C<sub>K</sub>},将超像素<img file="FDA000027673042000112.GIF" wi="70" he="72" />的多模态特征表示为一个基于字典γ非归一化的直方图,记为H<sub>p</sub>;对前景区域<img file="FDA00002767304200021.GIF" wi="74" he="81" />和背景区域<img file="FDA00002767304200022.GIF" wi="74" he="73" />分别统计其所包含的超像素的联合聚类的分布情况,统计前景区域和背景区域中各个超像素各自所属聚类中心形成统计直方图,分别作为前景区域模型H<sub>fg</sub>和背景区域模型<img file="FDA00002767304200023.GIF" wi="242" he="82" />步骤三,利用上述结果,建立一个不规则图,超像素作为不规则图的节点,结合输入图像组中每幅图像中超像素的空间邻接矩阵M<sup>(t)</sup>,建立节点间的连接边以及边上的权重,将能量方程<maths num="0004"><![CDATA[<math><mrow><msub><mi>E</mi><mrow><mi>cos</mi><mi>eg</mi></mrow></msub><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>2</mn></msubsup><mrow><mo>(</mo><msub><mi>&Sigma;</mi><mi>p</mi></msub><msub><mi>&omega;</mi><mrow><mi>p</mi><mo>,</mo><mi>i</mi></mrow></msub><msub><mi>x</mi><mrow><mi>p</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>+</mo><msub><mi>&Sigma;</mi><mrow><mi>p</mi><mo>~</mo><mi>q</mi></mrow></msub><msub><mi>&omega;</mi><mrow><mi>pq</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><msub><mi>x</mi><mrow><mi>p</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>-</mo><msub><mi>x</mi><mrow><mi>q</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><mo>)</mo></mrow><mo>+</mo><msub><mi>&Sigma;</mi><mi>global</mi></msub><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>转化为不规则图的最大流/最小割问题,使用BP算法进行求解。
地址 300072 天津市南开区卫津路92号