摘要 |
Un procédé pour identifier, récupérer ou classer des documents par langue ou par thème inclut les étapes de créer un tableau de segments à n caractères pour chaque document d'une base de données, d'analyser un document non identifié ou question en segments à n caractères, d'affecter un poids à chaque segment à n caractères, de supprimer le facteur commun des segments à n caractères, de comparer chaque document non identifié ou question à chaque document de la base de données, de calculer un score pour le document non identifié ou question par rapport à chaque document de la base de données pour la similarité. En se basant sur le score de similarité le document ou question est identifié, récupéré ou classé par rapport à la langue ou au thème.
|