摘要 |
A találmány tárgya eljárás csonkított betűkészlettel írott adottnyelvű szöveg helyreállítására, amelynek során - ugyanezen nyelvközkeletű szövegét statisztikailag elemezve első adatbázist (SZ1)készítenek, amelyben szerepel az egyes szóalakok előfordulásigyakorisága, - a csonkított betűkészlettel készített szövegetfogadnak, és minden egyes szót összehasonlítanak az adatbázisba (SZ1)felvett szavakkal és azok előfordulási gyakoriságával, - minden egyescsonkított betűkészlettel írt szót a legnagyobb előfordulásigyakoriságú csonkítatlan betűkészlettel írt megfelelő szóvalbehelyettesítve a szöveget helyreállítják. Célszerűen a csonkítottbetűkészlettel írt szavak csonkítatlan betűkészlettel írt szavakkaltörténő helyettesítéséhez az első adatbázisban (SZ1) szereplő szavakközül kiválasztják azon szavakat, amelyek a betűkészlet csonkításakormás alakúra változnak, és ezekből második adatbázist (EK) készítenek,amely minden más alakúra változott szóhoz hozzárendelve tartalmazza alegnagyobb előfordulási gyakoriságú csonkítatlan betűkészlettel írtmegfelelő szót, és helyreállításhoz minden egyes szót megvizsgálnak,hogy szerepel-e a második adatbázisban (EK) és a második adatbázisban(EK) szereplő szavakat behelyettesítik a megfelelő, a legnagyobbelőfordulási gyakoriságú csonkítatlan betűkészlettel írt szóval. Ó |