摘要 |
<p>Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum automatischen Lesen von Adressen in mehr als einer Sprache, von denen mindestens eine eine nichtlateinische Schrift aufweist. Die Vorrichtung besitzt- für jede vorgesehene Sprache eine OCR-Zeichenerkennungseinheit (5) zum Lesen der Schriftzeichen in den Gebieten mit den Adressblöcken, deren Leseergebnisse in einer sprachneutralen Transliterations-Repräsentation dargestellt werden, eine Adressanalyseeinheit (6) zum Auswerten der in den OCR-Zeichenerkennungseinheiten gelesenen Zeichen, in der anhand von sprachbezogenen Syntax-Regeln die verschiedenen Adresselemente ermittelt und klassifiziert werden, eine Adressinterpretationseinheit (7) zum Verifizieren der identifizierten Adresselemente mit Hilfe einer Adressdatenbasis, die zu jedem Eintrag verschiedene sprachabhängige Transliterationsvarianten enthält, wobei bei Übereinstimmung der zu verifizierenden gelesenen Adresse mit einer der Transliterationsvarianten eines Eintrages oder einer Ähnlichkeit im festgelegten Ähnlichkeitsmaß die Adresse akzeptiert wird.</p> |