摘要 |
<p>Es werden die vom OCR-Leser erzielten Leseergebnisse einer vereinbarten Anzahl von Sendungsbildern, unterteilt in eindeutig gelesene und zurückgewiesene Leseergebnisse, zwischengespeichert. DOLLAR A Dann werden Klassen von Wörtern oder zusammengehörenden Wortgruppen der zwischengespeicherten und zurückgewiesenen Leseergebnisse, bestehend jeweils aus n Adreßwörtern, n = 1, 2, ..., a, mit den Wortabständen m, m = 0, 1, ..., b, gebildet, die bezogen auf jeweils einen bestimmten n- und m-Wert untereinander ein bestimmtes Ähnlichkeitsmaß nicht unterschreiten. Mindestens Repräsentanten derjenigen Klassen, deren Häufigkeit einen festgelegten Wert überschreiten, werden in das oder die Wörterbücher der zugeordneten Adreßbereiche aufgenommen.</p> |