主权项 |
一种地址信息库驱动下的邮政信函按址分拣方法,其特征在于,所述地址信息库中的每个投递地址至少拥有一种包含实现转口分拣、本口分拣以及供道段投递使用的地址信息的文字表示,将通过图像采集和字符识别获得的所述邮政信函的地址文字表示与所述地址信息库中的投递地址进行遍历匹配,根据匹配度获得所述邮政信函的分拣信息,实现邮政信函的转口分拣、本口分拣以及本口分拣后的道段投递,所述字符识别获得所述邮政信函的地址文字表示的步骤包括:对信函图像进行分析,得到收件人地址的区域;对地址区的汉字采用分割算法进行分割,得到多行文字后将每行文字再分割为多个单字;对每个单字采用汉字识别算法进行识别,获得所述邮政信函的地址文字表示;其中,采用第一汉字分割算法和第二汉字分割算法将每行文字分割成单字,对于第一汉字分割算法得到的单字,分别采用L汉字识别算法和W汉字识别算法对单字进行识别,对于第二汉字分割算法得到的单字,采用H汉字识别算法进行单字识别,对于H、L和W汉字识别算法,这三种识别算法结果进行对齐,产生一个字符串集D,该字符串集D的每个位置都有1至3个候选字,对于字符串集D,若需要进行转口分拣,则使用转口表地址条目与D进行匹配,判决得到分拣信息;若需要进行本口分拣,则使用本口地址表进行匹配,判决得到本口分拣信息;若进行本转口混合分拣,则先进行转口地址识别,若结果为本口信函时,再进行本口地址识别。 |