发明名称 字符识别装置和字符识别方法
摘要 本发明是一种字符识别设备,它包括背景辨别部分(13),非字符线条辨别部分(14),产生第一非字符线条消除图像的第一非字符线条消除图像产生部分(17),所述第一非字符线条消除图像是除去非字符线条的初始图像,第一字符区辨别部分(15),放大图像产生部分(16),第二非字符线条消除图像产生部分(17),判断初始图像中,字符和非字符线条是否相互干扰的干扰判断部分(18),根据字符图像的颜色信息和非字符线条的颜色信息之间的差异,恢复字符图像的字符图像恢复部分(19),第二字符区辨别部分(20),和把第二字符区辨别部分(20)辨别的字符区数字化,并识别字符的字符识别部分(21),从而高度准确地识别在彩色表格上书写的字符。
申请公布号 CN1313963C 申请公布日期 2007.05.02
申请号 CN200410078789.9 申请日期 2004.09.17
申请人 富士通株式会社;富士通先端科技株式会社 发明人 金元浩一;胜又裕;江口真一
分类号 G06K9/20(2006.01) 主分类号 G06K9/20(2006.01)
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 康建忠
主权项 1、一种字符识别设备,用于从包括字符图像的初始图像抽取字符图像并关于字符图像识别字符,包括:根据初始图像中每一颜色分量的色散量和颜色属性的频率分布,辨别背景区的背景辨别部分(13);辨别除字符之外的非字符线条,并根据初始图像中与构成背景区的像素不同的像素的颜色属性的频率分布,和均具有相同的颜色属性并连续预定数目以上的连续像素,获得非字符线条的非字符线条信息的非字符线条辨别部分(14);产生第一非字符线条消除图像的第一非字符线条消除图像产生部分(17),其中通过在初始图像中,用具有和背景相同的颜色分量的像素代替由非字符线条辨别部分(14)辨别的非字符线条,从初始图像中除去非字符线条;在第一非字符线条消除图像产生部分(17)产生的第一非字符线条消除图像中,辨别不同于背景区的,包括均具有相同颜色属性并且连续预定数目以上的连续像素的区域的第一字符区辨别部分(15);根据初始图像,产生放大图像的放大图像产生部分(16);产生第二非字符线条消除图像的第二非字符线条消除图像产生部分(17),其中通过根据非字符线条辨别部分(14)获得的非字符线条信息,在放大图像产生部分(16)产生的放大图像中,用具有和背景相同颜色分量的背景像素代替非字符线条,从放大图像中除去非字符线条;根据非字符线条辨别部分(14)获得的非字符线条信息,和第一字符区辨别部分(15)辨别的字符区,判断初始图像中,字符图像和非字符线条是否相互干扰的干扰判断部分(18);当干扰判断部分(18)判断字符图像和非字符线条相互干扰时,根据字符图像的颜色属性和非字符线条的颜色属性之间的差异,关于第二非字符线条消除图像中的字符图像和非字符线条之间的干扰点,恢复字符图像的字符图像恢复部分(19);把大于预定尺寸的区域辨别为字符区的第二字符区辨别部分(20),该区域是第二非字符线条消除图像中除背影区之外的、包括均具有相同颜色属性并连续预定数目以上的连续像素的区域;和把第二字符区辨别部分(20)辨别的字符区数字化,并识别字符的字符识别部分(21);其中所述背景辨别部分(13)通过以下辨别背景区:利用初始图像的每一像素的每一颜色分量的偏差,计算每一颜色分量的色散量,根据每一颜色分量的色散量,区分构成背景区的像素,产生构成背景区的像素的颜色属性的频率分布;以及根据频率分布的峰值区分背景区,其中所述非字符线条辨别部分(14)包括:分别关于初始图像的垂直方向和水平方向,计算具有和构成背景区的像素不同的颜色属性的像素的频率分布,并根据计算结果,把具有大于预定值的频率的位置辨别为非字符线条可能位置的非字符线条位置估计部分(23),根据非字符线条位置估计部分(23)辨别的非字符线条可能位置中的颜色属性的频率分布,确定非字符线条的颜色属性的颜色信息确定部分(24),和关于与颜色信息确定部分(24)确定的颜色属性相同的颜色属性,根据像素的连续性,获得非字符线条的非字符线条信息的非字符线条信息获取部分(25),其中字符图像恢复部分(19)关于第二非字符线条消除图像中的字符图像和非字符线条之间的干扰点,根据字符图像的颜色属性和非字符线条的颜色属性之间的差异,形成字符图像中的字符轮廓,并且用具有和所述字符图像的颜色属性相同的颜色属性的像素,填充字符轮廓围绕的区域。
地址 日本神奈川