发明名称 一种基于图割的复杂背景文本图像分割方法
摘要 本发明公开了一种基于图割的复杂背景文本图像分割方法,其包括步骤:1)将原始文本块图像粗分为子图;2)通过估计每个子图的极性,最终决定整个文本块图像的极性;3)根据文本块图像的极性,结合字符笔画的固有特征,自动提供一些置信度较高的前景背景点作为图割的硬约束;4)对子图施加相应的软约束,用图割将硬约束传播到整个子图,进而分割子图;5)将分割的子图合并获得整体的文本分割图像。本发明方法采用分-合的技术,具有局部空间自适应性,从而可以应对背景不均匀的复杂背景文本块图像;同时,本方法自动为图割提供硬约束,结合软约束将硬约束扩展到整幅子图,因此对背景复杂的文本图像可以取得较好的分割效果。
申请公布号 CN102332097B 申请公布日期 2013.06.26
申请号 CN201110322549.9 申请日期 2011.10.21
申请人 中国科学院自动化研究所 发明人 王春恒;史存召;肖柏华;周文
分类号 G06K9/20(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 周国城
主权项 一种基于图割的复杂背景文本图像分割方法,其特征在于,包括以下步骤:步骤1,将原始文本块图像粗分为若干个子图;步骤2,通过判断每个子图的极性,确定整个文本块图像的极性;步骤3,根据文本块图像的极性,结合字符笔画的固有特征,自动为图割提供一些置信度较高的前景点和背景点作为图割的硬约束;步骤4,根据获得的硬约束,对子图施加相应的软约束,用图割将硬约束传播到整个子图,进而得到子图的最优分割;步骤5,将得到的最优分割的子图合并得到整体的文本分割图像;所述步骤4中的软约束为图割的损失函数,所述损失函数E(L)包括区域损失R(L)和边界损失B(L):E(L)=λR(L)+B(L),其中,λ为R(L)与B(L)之间的比重关系;所述区域损失R(L)是将某个像素划分为前景或者背景所带来的损失: <mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>L</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>p</mi> <mo>&Element;</mo> <mi>P</mi> </mrow> </munder> <msub> <mi>R</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>L</mi> <mi>p</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>其中,p为图中的某一节点,P表示节点的集合;Lp为节点p的分割标签;每个像素的区域损失Rp(Lp)包括两部分:Rp(Lp)=Rp(0)+Rp(1),其中,Rp(1)是将此像素划分为前景的损失,Rp(0)是将此像素划分为背景的损失;所述边界损失B(L)是相邻像素不连续导致的损失: <mrow> <mi>B</mi> <mrow> <mo>(</mo> <mi>L</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>&Sigma;</mi> <mrow> <mo>{</mo> <mi>p</mi> <mo>,</mo> <mi>q</mi> <mo>}</mo> <mo>&Element;</mo> <mi>N</mi> </mrow> </munder> <msub> <mi>B</mi> <mrow> <mo>{</mo> <mi>p</mi> <mo>,</mo> <mi>q</mi> <mo>}</mo> </mrow> </msub> <mo>*</mo> <mi>&delta;</mi> <mrow> <mo>(</mo> <msub> <mi>L</mi> <mi>p</mi> </msub> <mo>,</mo> <msub> <mi>L</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>其中,p、q为图中相邻的两点,N为相邻像素点的集合,B{p,q}为相邻两点的边界损失,δ(Lp,Lq)为冲击函数。
地址 100190 北京市海淀区中关村东路95号