发明名称 一种通用的公共草图提取方法
摘要 本发明属于计算机视觉和图像理解领域,涉及一种通用的公共草图提取方法,包括:(1)输入多个图片,将第一幅输入图片作为参考图片;对于每个输入图片,生成具有旋转不变性局部自相似描述符:对参考图片与其他图片中的每一幅分别进行如下的处理:划分子图,进行子图匹配,检测输入图片最相似区域,求得。对各个图片进行旋转,使所有图片共同部分的方向一样;计算预处理后的图片的最相似子图,并将其合并,得到共同部分S的描述符集;由S的描述符集得到二进制草图。本发明可应用于旋转情况下图片的共同部分检测与草图提取中,解决旋转情况下草图提取问题,能够生成比较好的草图。
申请公布号 CN102609707A 申请公布日期 2012.07.25
申请号 CN201210009405.2 申请日期 2012.01.12
申请人 天津大学 发明人 操晓春;陈静静;张华;宋涛
分类号 G06K9/46(2006.01)I;G06K9/54(2006.01)I 主分类号 G06K9/46(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 程毓英
主权项 1.一种通用的公共草图提取方法,包括下列步骤:(1)输入图片I<sub>1</sub>,I<sub>2</sub>,I<sub>3</sub>....I<sub>k</sub>,将其中的第一幅输入图片I<sub>1</sub>作为参考图片;(2)对于每个输入图片,进行如下的处理,生成具有旋转不变性局部自相似描述符:a.对于一张图片的每个像素点(x,y),以这个像素点为中心取一个图像小块,对于这个图像小块,在它周围取一个更大的区域,计算这个图像小块与这个区域内所有像素的图像小块之间的相似度,采用颜色值之间的SSD计算,得到颜色差值平面SSD<sub>q</sub>(x,y);b.按照公式<img file="FDA0000130541740000011.GIF" wi="810" he="132" />对SSD<sub>q</sub>(x,y)转化,生成一个相关平面S<sub>q</sub>(x,y),式中,var<sub>noise</sub>,是一个常量,表示可以接受的光学的差异,var<sub>auto</sub>(q)是以像素点q为中心半径为1像素的区域内像素点的图像小块的SSD的最大值;c.对相关平面S<sub>q</sub>(x,y)划分,分成一个个小单元,取每个单元里的最大相似度值,最后对这些单元成一列,生成了局部自相似描述符;d.指定从相似度值最大的单元展开,排成一列,并储存与原来描述符的偏移,生成具有旋转不变性局部自相似描述符;(3)对参考图片与其他图片分别做如下的处理:a.将参考图片和其他图片中的一个按相同的子图大小,划分子图;b.设定过滤的上限阈值和下限阈值,先对两个图片的描述符进行过滤,过滤掉相似度过高和相似度过低的像素点的描述符;c.定义子图之间的匹配度为匹配上的描述符的个数与此子图内总的描述符个数的比值,计算参考图片每个子图在与其他图片子图的匹配度,若对于参考图片的某个子图,在其他图片中存在多个匹配度高于预设值的子图,判断这几个子图是否相邻,若相邻则将这几个子图合并为一个子图;d.记录参考图片每个子图对应的最大匹配度,若参考图片中存在多个最大匹配度高于预设值的子图,则判断这几个子图是否相邻,若相邻,则合并参照图片的这几个子图。对其他图片的每个子图的描述符找出在参考图片中的相似点所在的子图编号,并且统计它的分布,若其他图片的子图在参考图片的某几个子图的相似频率高于预设值,再判断这几个子图是否相邻,若相邻则将这几个子图合并为一个子图;e.对两幅输入图片中对应的两个匹配度最高的子图中像素点的描述符进行匹配,对匹配上的描述符统计偏移差,统计偏移差的频率分布,取最大的频率对应的偏移差,并计算出旋转角度;(4)将图片I<sub>2</sub>,I<sub>3</sub>....I<sub>k</sub>按各自相应的旋转角度逆时针旋转,得到图片I′<sub>2</sub>,I′<sub>3</sub>,....I′<sub>k</sub>,此时所有图片共同部分的方向一样;(5)按照下列方法得到I<sub>1</sub>,I′<sub>2</sub>,......I′<sub>k</sub>间最相似的子图<img file="FDA0000130541740000012.GIF" wi="380" he="73" />a.对I<sub>1</sub>的每一个像素点x所构成的子图在I′<sub>2</sub>.....I′<sub>k</sub>找到与之相似度最高的子图<img file="FDA0000130541740000021.GIF" wi="265" he="71" />其中C<sub>k</sub>表示子图的中心点位置;b.在I<sub>1</sub>中找到满足<maths num="0001"><![CDATA[<math><mrow><mfrac><mn>1</mn><mrow><mi>K</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>2</mn></mrow><mi>K</mi></munderover><mrow><mo>(</mo><mi>max</mi><mi>Match</mi><mrow><mo>(</mo><msubsup><mi>I</mi><mn>1</mn><msub><mi>C</mi><mn>1</mn></msub></msubsup><mo>,</mo><msubsup><mi>I</mi><mi>K</mi><mrow><mo>&prime;</mo><msub><mi>C</mi><mi>K</mi></msub></mrow></msubsup><mo>)</mo></mrow><mo>-</mo><mi>avgMatch</mi><mrow><mo>(</mo><msub><mi>I</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>/</mo><mi>stdMatch</mi><mrow><mo>(</mo><msub><mi>I</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>最大的子图,并且记录最大子图对应的其他图片中的子图,其中,<img file="FDA0000130541740000023.GIF" wi="412" he="57" />是I<sub>1</sub>中以C<sub>1</sub>为中心的子图与I<sub>K</sub>中子图匹配的最大相似度,avgMatch(I<sub>1</sub>)是I<sub>1</sub>中以x点为中心的子图与其他的图的最大的匹配相似度的平均值,stdMatch(I<sub>1</sub>)是I<sub>1</sub>中以x点为中心的子图与其他的图的最大匹配相似度的标准差,<img file="FDA0000130541740000024.GIF" wi="352" he="72" />即为包含共同部分大小为w*h的子图,其中,w表示子图宽度,h表示子图高度;(6)对与中心C<sub>1</sub>,C<sub>2</sub>,...C<sub>k</sub>相对位置相同的像素点的描述符进行合并,合并后的描述符集即为共同部分S的描述符集;(7)由S的描述符集得到二进制草图。
地址 300072 天津市南开区卫津路92号