发明名称 证件号码定位和识别方法
摘要 本发明证件号码定位和识别方法,属于OCR技术领域,从包含证件号码的图像中定位和识别证件号码,本方法首先利用图像的水平投影值,将所述图像分割成一个或多个个行区域;然后利用所述行区域的图像的宽高比、证件号码宽高宽高比特征,去除不可能是证件号码所在的行;接着将可能包含证件号码的所述每个行区域分割成一个或多干个列区域,利用证件号码位数及间距较小的特征,从而定位出所述证件号码在图像上的位置;最后利用识别引擎对所述证件号码的区域图像的进行识别。本发明可简单、方便、快速的完成身份证、军官证、护照、驾驶执照等证件号码信息的获取,从而大大降低了人力成本,提高了工作效率。
申请公布号 CN101751568B 申请公布日期 2012.07.18
申请号 CN200810239544.8 申请日期 2008.12.12
申请人 汉王科技股份有限公司 发明人 肖潇;刘正珍
分类号 G06K9/20(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 代理人
主权项 一种证件号码定位和识别方法,其特征在于,包括如下步骤:步骤一:利用输入的证件图像在水平方向上的灰度累加值进行图像的行区域分割,得到一个或多个行区域;步骤二:将得到的各行区域的宽高比与证件号码的宽高比相比较,去除不在证件号码宽高比设定值范围内的行区域;步骤三:对得到的可能是证件号码所在的行区域进行列分割,利用证件号码位数确定证件号码所在行区域;对得到的可能是证件号码所在的行区域进行列分割时,对行区域从左至右、或从右至左进列扫描,得到行区域的垂直投影直方图,选定一阈值用于确定列区域的开始与结束位置,从而将行图像分割成若干个列图像,根据证件号码特点,若此行得到的列区域的个数大于等于证件号码的总个数,则此行确定为证件号码所在行区域;步骤四:利用证件号码位数及证件号码间的间距特征确定证件号码在图像上的左右边界位置,得到各证件号码的所在区域图像;若连续出现两两之间间距较小的与证件号码位数相同的列区域,则设置一个阈值,当连续出现与证件号码位数相同的列区域,且每连续两个列图像之间的间距都小于所述阈值时,这些列区域最左、最右边界为证件号码所在图像区域的左、右边界;步骤五:利用识别引擎对所述证件号码的所在区域图像进行字符识别。
地址 100094 北京市海淀区东北旺西路8号5号楼三层