发明名称 在OCR过程中将词语位图分割为单个字符或字形
摘要 提供一种图像处理装置,包括在进行OCR处理的文本图像的位图中将词语分割为单个字符的字符截断器组件。字符截断器组件被配置为产生(可能是弯曲的)截断线的集合,所述截断线将任何给定的词语的位图分为其单个字符或字形候选。当输入的位图包含两个独立的词语,这种情况可以通过标记这些词语应当被拆分的位置来处理。通过考虑在给定的词语位图中的字形和背景颜色,字符分割算法计算垂直方向的、弯曲的截断线的集合。随后为了保存那些确实分隔了词语的字形的线以及将那些没有分隔词语的字形的线的数目减到最少,使用各种试探法过滤所述集合。
申请公布号 CN102870399B 申请公布日期 2015.09.02
申请号 CN201180023323.7 申请日期 2011.04.28
申请人 微软技术许可有限责任公司 发明人 D·尼耶姆切维奇
分类号 H04N1/387(2006.01)I;H04N1/04(2006.01)I;H04N1/00(2006.01)I;G06K9/00(2006.01)I 主分类号 H04N1/387(2006.01)I
代理机构 中国专利代理(香港)有限公司 72001 代理人 董宁;汪扬
主权项 一种从文本位图生成字符或字形的装置,包括:输入组件,用于接收包括至少一个文本行的图像的位图,所述文本行通过基准线和中间线识别;字符截断器组件,包括用于生成多个截断线的候选截断线生成器组件,每一个截断线分隔所述文本行中的一对相邻的字符或字形,其中,所述候选截断线生成器组件被配置为穿过至少一行中的每个像素产生候选截断线,所述至少一行在所述文本行中并沿着所述文本行延伸,所述字符截断器组件进一步包括用于选择所述候选截断线的子集的截断线选择组件,所述候选截断线的子集对应于每一个均分隔所述文本行中的一对相邻的字符或字形的多个截断线;以及输出组件,应用所述截断线到文本行中以产生所述字符或字形。
地址 美国华盛顿州