摘要 |
<p>L'invention porte sur un système de recherche d'informations comportant; une structure de données de stockage d'un texte T; un métrique M combiné de mesure du niveau de concordance évaluant le niveau approximatif de concordance entre des mots et/ou des symboles, ou des phrases en étant faites, du texte T, et des mots ou symboles d'une séquence P; des fonctions de pondération des mots dans des opérations de mise au point de textes transformant une séquence S de mots ou de symboles en une séquence P; et un algorithme de recherche déterminant le niveau de concordance entre des mots ou séquences de mots dans une représentation présentant respectivement le texte T et la question Q. L'algorithme recherche la structure de données en posant la question Q et récupère l'information correspondant spécifiquement. L'invention porte en outre sur un procédé lié à un système de recherche d'informations produisant un arbre à suffixe de mots clairsemés stockant des suffixes de mots d'un texte T sous forme d'une séquence de mots d'information, recourant à un métrique de mesure du niveau de concordance entre les séquences de mots S et P, comportant des fonctions de coût pondérées en mots pour les opérations de mise au point de textes, et déterminant les correspondances entre les séquences de mots Sr des informations R récupérées et les séquences de mots Pq de la demande Q en calculant le niveau de concordance pour toutes les correspondances. L'invention porte en outre sur son utilisation dans un automate de recherche par approximation.</p> |