发明名称 |
一种基于稀疏编码特征的场景文本识别方法 |
摘要 |
一种基于稀疏编码特征的场景文本识别方法,涉及计算机视觉和模式识别。输入待识别的自然场景文本图像;采用多尺度滑动窗口的方法,用字符分类器对图像中的窗口区域进行检测和识别,对每一个字符类别,将分类器输出较大的区域判定为候选字符区域,输出较小的区域认为是背景区域,这样找出图像中包含的候选字符区域,再采用非极大值抑制方法,对重叠率较大的区域只保留分类器输出值最大的区域和相应的字符类别,除去重复冗余的候选字符区域,得到字符检测结果;将检测到的字符合并成一个词或文本行;输出场景文本识别结果。能够更加有效地表示和提取字符的结构特征,从而提高场景文本的识别率。 |
申请公布号 |
CN103942550A |
申请公布日期 |
2014.07.23 |
申请号 |
CN201410184072.6 |
申请日期 |
2014.05.04 |
申请人 |
厦门大学 |
发明人 |
王菡子;王大寒;章冬 |
分类号 |
G06K9/20(2006.01)I;G06K9/46(2006.01)I |
主分类号 |
G06K9/20(2006.01)I |
代理机构 |
厦门南强之路专利事务所(普通合伙) 35200 |
代理人 |
马应森 |
主权项 |
一种基于稀疏编码特征的场景文本识别方法,其特征在于包括如下步骤:步骤S1:输入待识别的自然场景文本图像;步骤S2:采用多尺度滑动窗口的方法,用字符分类器对图像中的窗口区域进行检测和识别,对每一个字符类别,将分类器输出较大的区域判定为候选字符区域,输出较小的区域认为是背景区域,这样找出图像中包含的候选字符区域,再采用非极大值抑制方法,对重叠率较大的区域只保留分类器输出值最大的区域和相应的字符类别,除去重复冗余的候选字符区域,得到字符检测结果;步骤S3:将检测到的字符合并成一个词或文本行;步骤S4:输出场景文本识别结果。 |
地址 |
361005 福建省厦门市思明南路422号 |