摘要 |
Ce procédé de classification thématique de documents, notamment pour la constitution ou la mise à jour de bases de données thématiques (42) pour moteur de recherche, comprend les étapes de sélection de documents représentatifs de chaque thème, identification, dans les documents sélectionnés, des éléments caractéristiques de chaque thème, affectation, à chaque élément identifié, d'un coefficient (R) représentatif de la pertinence de cet élément vis à vis du thème correspondant et, pour chaque document (50) à classifier, identification desdits éléments caractéristiques de chaque thème qu'il contient et, pour chaque thème qui leur correspond, calcul, à partir du coefficient affecté à ces éléments, de la valeur d'une caractéristique représentative de la pertinence du thème pour ce document (50) pour décider si ce document porte ou non sur ce thème.
|