发明名称 |
用于切分具有不同字符宽度的文本行中的字符的方法和系统 |
摘要 |
提供了一种用于切分具有不同字符宽度的文本行中的字符的方法和系统。该方法包括:第一切分步骤,根据基于投影的方法将所述文本行切分为第一字符集合;计算步骤,基于所述第一字符集合计算平均字符宽度;强制切分步骤,基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行强制切分,以获得第二字符集合;设置步骤,针对所述第二字符集合中的不同字符设置不同的平均字符宽度;以及组合步骤,通过根据所设置的不同的平均字符宽度创建不同的切分模式并且选择最佳切分模式,对所述第二字符集合中的字符进行组合。 |
申请公布号 |
CN103106406B |
申请公布日期 |
2016.10.05 |
申请号 |
CN201110352060.6 |
申请日期 |
2011.11.09 |
申请人 |
佳能株式会社 |
发明人 |
罗兆海;李献 |
分类号 |
G06K9/34(2006.01)I |
主分类号 |
G06K9/34(2006.01)I |
代理机构 |
中国国际贸易促进委员会专利商标事务所 11038 |
代理人 |
付建军 |
主权项 |
一种用于切分具有不同字符宽度的文本行中的字符的方法,包括以下步骤:第一切分步骤,根据基于投影的方法将所述文本行切分为第一字符集合;计算步骤,基于所述第一字符集合计算平均字符宽度;重新切分步骤,基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行重新切分,以获得第二字符集合,其中宽字符的宽度大于预定值;其特征在于还包括:设置步骤,基于所述第二字符集合中的字符来设置与计算的平均字符宽度不同的另一平均字符宽度;以及组合步骤,通过创建多个组合模式根据从多个组合模式中选择的一个组合模式来对所述第二字符集合中的字符进行组合,每个组合模式基于计算的平均字符宽度和设置的字符宽度来组合所述第二字符集合中的字符,其中,所述重新切分步骤包括以下步骤:对于宽度大于预定值的每个宽字符,产生多个由所述宽字符或所述宽字符和相邻字符的组合构成的切分组,并基于所述平均字符宽度在每个切分组中搜索可能的切分点并获得每个切分点的分数;基于切分组中的每个切分点的分数计算每个切分组的分数;以及从所有组中选择具有最小分数的切分组作为重新切分结果。 |
地址 |
日本东京 |