摘要 |
Des caractères qui se touchent sur un document écrit sont identifiés et separés selon leurs contours. Les éléments apparaissant sur le document sont divisés en deux catégories comprenant respectivement ceux qui possèdent des contours internes fermés et ceux qui n'en possèdent pas. Un élément de la première catégorie possédant soit un contour interne fermé qui n'est pas centré par rapport à l'élément, soit deux contours internes fermés horizontalement décalés, soit plus de deux contours internes fermés, est identifié comme contenant deux caractères qui se touchent et est divisé selon l'épaisseur des barres de caractère observées dans le document. Un élément de la seconde catégorie dont les contours coupent trois lignes de référence horizontales espacées en un nombre de points supérieur un nombre prédéterminé est comparé aux modèles d'intersection caractéristiques des caractères isolés. Si aucune correspondance n'est trouvée, l'élément est considéré comme ayant des caractères qui se touchent. |