发明名称 一种地址信息库驱动下的邮政信函按址分拣方法
摘要 本发明公开了一种地址信息库驱动下的邮政信函按址分拣方法,所述地址信息库中的每个投递地址至少拥有一种包含实现转口分拣、本口分拣以及供道段投递使用的地址信息的文字表示,将通过图像采集和字符识别获得的所述邮政信函的地址文字表示与所述地址信息库中的投递地址进行遍历匹配,根据匹配度获得所述邮政信函的分拣信息,实现邮政信函的转口分拣、本口分拣以及本口分拣后的道段投递。本发明实际应用于信函分拣机的识别模块中,在地址库相对准确完整、识别率基本保证的情况下,该方法能够有效对信函地址识别结果进行分析校正,得到准确的信函分拣信息,即可以完全依靠对信函地址识别结果进行信函分拣。
申请公布号 CN101844135B 申请公布日期 2013.05.08
申请号 CN201010170949.8 申请日期 2010.05.11
申请人 上海邮政科学研究院 发明人 吕岳;范生淼;吕淑静;屠晓;姚心宇
分类号 B07C3/10(2006.01)I 主分类号 B07C3/10(2006.01)I
代理机构 上海伯瑞杰知识产权代理有限公司 31227 代理人 吴泽群
主权项 一种地址信息库驱动下的邮政信函按址分拣方法,其特征在于,所述地址信息库中的每个投递地址至少拥有一种包含实现转口分拣、本口分拣以及供道段投递使用的地址信息的文字表示,将通过图像采集和字符识别获得的所述邮政信函的地址文字表示与所述地址信息库中的投递地址进行遍历匹配,根据匹配度获得所述邮政信函的分拣信息,实现邮政信函的转口分拣、本口分拣以及本口分拣后的道段投递,所述字符识别获得所述邮政信函的地址文字表示的步骤包括:对信函图像进行分析,得到收件人地址的区域;对地址区的汉字采用分割算法进行分割,得到多行文字后将每行文字再分割为多个单字;对每个单字采用汉字识别算法进行识别,获得所述邮政信函的地址文字表示;其中,采用第一汉字分割算法和第二汉字分割算法将每行文字分割成单字,对于第一汉字分割算法得到的单字,分别采用L汉字识别算法和W汉字识别算法对单字进行识别,对于第二汉字分割算法得到的单字,采用H汉字识别算法进行单字识别,对于H、L和W汉字识别算法,这三种识别算法结果进行对齐,产生一个字符串集D,该字符串集D的每个位置都有1至3个候选字,对于字符串集D,若需要进行转口分拣,则使用转口表地址条目与D进行匹配,判决得到分拣信息;若需要进行本口分拣,则使用本口地址表进行匹配,判决得到本口分拣信息;若进行本转口混合分拣,则先进行转口地址识别,若结果为本口信函时,再进行本口地址识别。
地址 200062 上海市普陀区中山北路3185号