发明名称 自然场景中商铺标牌汉字区域自动检测方法
摘要 本发明公开了一种自然场景中商铺标牌汉字区域自动检测方法,包括以下步骤:A、获取反映采样区图像主要像素颜色的向量V1和V2;B、利用向量V1和V2确定原始图像的背景轮廓;C、将HSV颜色空间划分为黑色、白色、红色、黄色、绿色、青色、蓝色、品红八块颜色空间;D、对原始图像进行颜色分层,得到8张颜色分布二值图;E、对8张颜色分布二值图进行汉字连通域分析,获得8张文本行二值图;F、对各张文本行二值图中不符合汉字书写规则的文本行进行过滤,得到精化后的汉字区域;G、将不同颜色的精化汉字区域进行融合,获得原始图像中的汉字区域。本发明能够有效提高汉字区域检测的准确度,对基于自然场景下的汉字识别的应用具有重要意义。
申请公布号 CN105740860A 申请公布日期 2016.07.06
申请号 CN201610059409.X 申请日期 2016.01.28
申请人 河南大学 发明人 张重生;赵晓东
分类号 G06K9/32(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 郑州联科专利事务所(普通合伙) 41104 代理人 刘建芳
主权项 自然场景中商铺标牌汉字区域自动检测方法,其特征在于,包括以下步骤:A、扫描自然场景中的商铺标牌获得原始图像,从原始图像上截取矩形的采样区图像,并将采样区图像的RGB三通道展开,形成M*N行3列的矩阵,其中M为采样区图像的宽度,N为采样区图像的高度,分别将矩阵的每一行作为三维空间的一个点进行Kmeans聚类,设定聚类的类别数为2,得到两个聚类中心点,分别为向量V1和V2,然后进入步骤B;B、分别计算原始图像的每个像素点到向量V1和V2的距离,并创建两张与原始图像大小相同的初始化二值图bg1和bg2,初始化二值图bg1和bg2中所有像素点的像素值均为0,设定距离阈值X,依次比较原始图像的每个像素点到向量V1的距离与X的大小关系,当原始图像的像素点到向量V1的距离小于X时,在初始化二值图bg1中将与该像素点坐标相同的像素点的像素值置为1,得到粗轮廓二值图BG1;依次比较原始图像的每个像素点到向量V2的距离与X的大小关系,当原始图像的像素点到向量V2的距离小于X时,在初始化二值图bg2中将与该像素点坐标相同的像素点的像素值置为1,得到粗轮廓二值图BG2,分别对粗轮廓二值图BG1和BG2做形态学处理并进行连通域分析,从粗轮廓二值图BG1和BG2中选出面积最大的连通域进行修复和填充后作为背景轮廓,得到背景轮廓二值图;C、将HSV颜色空间划分为黑色、白色、红色、黄色、绿色、青色、蓝色、品红八块颜色空间,八块颜色空间的划分规则如下:黑色空间,v&lt;0.3or(v&lt;0.5and s&lt;=0.25);白色空间,v&gt;=0.5and s&lt;=0.25;红色空间,(h&lt;1/12or h&gt;=11/12)and v&gt;0.3and s&gt;=0.25;黄色空间,h&gt;=1/12and h&lt;3/12and v&gt;0.3and s&gt;=0.25;绿色空间,h&gt;=3/12and h&lt;5/12and v&gt;0.3and s&gt;=0.25;青色空间,h&gt;=5/12and h&lt;7/12and v&gt;0.3and s&gt;=0.25;蓝色空间,h&gt;=7/12and h&lt;9/12and v&gt;0.3and s&gt;=0.25;品红空间,h&gt;=9/12and h&lt;11/12and v&gt;0.3and s&gt;=0.25;式中h代表HSV颜色空间中的色调,s代表HSV颜色空间中的饱和度,v代表HSV颜色空间中的明度,然后进入步骤D;D、创建8张与原始图像大小相同的二值图,并将每张二值图上所有像素点的像素值置为0,将原始图像从RGB空间转换到HSV颜色空间中,然后判断HSV颜色空间中原始图像的每个像素点所属的颜色类型,将属于同一颜色类型的所有像素点映射到一张二值图的对应位置处,并将二值图上对应位置处的像素点的像素值置为1,最后得到8张颜色分布二值图,然后进入步骤E;E、将8张颜色分布二值图分别与背景轮廓二值图做与运算后再进行形态学处理,滤除8张颜色分布二值图中的细小沟壑和细线,得到8张细轮廓分布二值图,分别对8张细轮廓分布二值图进行连通域扫描,利用八连通标记法得到连通图对应的标记图,并计算每个连通域的属性,然后对8张细轮廓分布二值图中不符合汉字笔画特征的连通域进行过滤,得到8张笔画级分布二值图,分别对每一张笔画级分布二值图中符合汉字笔画特征的连通域进行合并,将合并后的多个连通域记为一个标记区域并确定标记值,对于任意两个标记区域,若一个标记区域的质心坐标位于另一个标记区域的最小外接矩形内,则将该标记区域的标记值置为另一个标记区域的标记值,最后对于每一张笔画级分布二值图,依次将标记值相同的标记区域记为一个文本行,获得8张文本行二值图,然后进入步骤F;F、对于8张文本行二值图中的任意一个文本行,当文本行的最小外接矩形的高度小于背景轮廓的最小外接矩形高度的1/20、文本行的最小外接矩形的宽高比小于7/10或者文本行的面积与其最小外接矩形的面积比小于1/10或大于4/5时,将该文本行从对应的文本行二值图上删除,得到的8张字符图像二值图,分别计算每一张字符图像二值图中所有文本行的面积和,当计算得到的面积和小于背景轮廓二值图的最小外接矩形面积的1/200时,将对应的字符图像二值图删除,并分别计算剩余的字符图像二值图中所有文本行的最小外接矩形的坐标,然后进入步骤G;G、创建一张与原始图像大小相同的空白图像,依次将剩余的字符图像二值图中所有文本行的最小外接矩形标记在空白图像的相应位置处,得到初级识别图像,分别将初级识别图像中由两个以上最小外接矩形组成的边界呈不规则多边形的独立区域作为一个识别区域,对于每一个识别区域,统计各个顶点的坐标,并从顶点坐标中选出x坐标的最小值记为x<sub>min</sub>,选出x坐标的最大值记为x<sub>max</sub>,选出y坐标的最小值记为y<sub>min</sub>,选出y坐标的最大值记为y<sub>max</sub>,以(x<sub>min</sub>,y<sub>min</sub>),(x<sub>max</sub>,y<sub>min</sub>),(x<sub>min</sub>,y<sub>max</sub>),(x<sub>max</sub>,y<sub>max</sub>)四个坐标作为顶点创建矩形区域,则从各个识别区域中得到的所有矩形区域以及初级识别图像中剩余的最小外接矩形组成的区域即为原始图像中的汉字区域。
地址 475001 河南省开封市明伦街85号