发明名称 光学字符识别中的技术
摘要 将图像纠偏系统和技术用于光学字符识别的上下文中。获取以原始线性(水平)定向的原始字符集的图像。相对于该原始线性定向偏斜一旋转角的所获取的字符集由该图像的像素表示。估计该旋转角,且可以将置信度值与该估计关联起来,以便判断是否纠偏该图像。结合旋转角估计,将边缘检测滤波器应用于所获取的字符集以便产生边缘图,将该边缘图输入到线性霍夫变换滤波器以便以参数形式产生一组输出线。给各输出线分配分数,且基于各分数将具有接近旋转角的斜率的至少一个输出线判断为主导线。
申请公布号 CN102279926A 申请公布日期 2011.12.14
申请号 CN201110165719.7 申请日期 2011.06.09
申请人 微软公司 发明人 D·尼耶姆切维奇;S·加利克
分类号 G06K9/32(2006.01)I;G06K9/00(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 蔡悦
主权项 一种用计算机可执行指令(806)编码的计算机可读存储介质(804)当所述计算机可执行指令被处理器(802)执行时,执行一种用于识别以原始线性定向(105)被显示在表面(102)上的原始字符集(104)的字符的方法(400),所述方法包括:在所述原始字符集的图像(111)内,标识(402)由所述图像的像素(210)表示的所获取的字符集(204),所获取的字符集具有相对于所述原始线性定向偏斜一旋转角(222)的所获取的线性定向(205);将边缘检测滤波器(304)应用(404)到所获取的字符集以便产生边缘图(306),所述边缘图标识包括所述图像的沿着与所获取的字符集相关联的多条线的像素在内的边缘像素(307);将所述边缘图输入(406)到线性霍夫变换滤波器(310)以便以(r,θ)参数形式产生一组输出线(311),其中对于每一输出线,r是垂直于所述输出线而画出的法线在原点和所述输出线所经过的特定边缘像素之间的长度,且θ是所述法线与水平轴形成的夹角;形成(408)具有行和列的矩阵(312),特定输出线(r,θ)所经过的所述边缘像素中的每一个由所述矩阵的位于所述特定输出线的对应于θ的特定行和所述特定输出线的对应于r的特定列的元素来表示;给每一输出线分配分数(313),所述分数基于在所述特定输出线的所述对应于θ的特定行内的边缘像素的离差;基于所述分数,在所述一组输出线内,标识(412)至少两个主导输出线(rdom1,θdom1)和(rdom2,θdom2);计算(416)对应于θdom1估计所述旋转角的似然的第一置信度值(351)计算(416)对应于θdom2估计所述旋转角的似然的第二置信度值(351);以及基于所述第一置信度值和第二置信度值,判断是θdom1还是θdom2估计所述旋转角。
地址 美国华盛顿州