摘要 |
Le système (100) amélioré de compression de données traite simultanément à la fois des chaînes de caractères répétés et une substitution textuelle de chaînes de caractères d'entrée. Selon ce système (100), on améliore la performance de techniques de compression de données basées sur la substitution textuelle, par l'emploi d'une représentation compacte permettant d'identifier les cas dans lesquels un caractère se trouvant dans le flux de données d'entrée est répété. On parvient à ce résultat par emboîtement d'un système (110) codant une longueur de passage, dans le système (111, 112, 120) de substitution textuelle. Cette structure ajoute la reconnaissance de passages d'un caractère répété avant que le processeur ne procède à l'opération de compression de données de substitution textuelle. On obtient une autre amélioration de performance en élargissant l'alphabet des symboles stockés dans le dictionnaire (120) du compresseur afin d'inclure à la fois les caractères du flux de données d'entrée et les comptages de répétition indiquant la répétition d'un caractère. La manipulation de ces comptages de répétition à l'aide de la technique de compression basée sur la substitution textuelle n'est pas différente de la manipulation de caractères, ou certaines modifications sont effectuées dans la manipulation de comptages de répétition. |