摘要 |
<p>Es werden die vom OCR-Leser erzielten Leseergebnisse einer vereinbarten Anzahl von Sendungsbildern, unterteilt in eindeutig gelesene und zurückgewiesene Leseergebnisse zwischengespeichert. Dann werden Klassen von Wörtern oder zusammengehörenden Wortgruppen der zwischengespeicherten und zurückgewiesenen Leseergebnisse, bestehend jeweils aus n Adresswörtern, n = 1, 2, ..., a, mit den Wortabständen m, m = 0, 1, ..., b, gebildet, die bezogen auf jeweils einen bestimmten n- und m-Wert untereinander ein bestimmtes Ähnlichkeitsmass nicht unterschreiten. Mindestens Repräsentanten derjenigen Klassen, deren Häufigkeit einen festgelegten Wert überschreiten, werden in das oder die Wörterbücher der zugeordneten Adressbereiche aufgenommen.</p> |