摘要 |
<p>L'invention concerne des solutions améliorées permettant de récupérer des informations représentées par des données textuelles numérisées. Ces données sont ensuite supposées être organisées en termes (431 - 438), en documents et en corpus de documents, chaque document renfermant au moins un terme (431 - 438) et chaque corpus de documents renfermant au moins un document. En fonction d'un vecteur conceptuel (420 - 424), classifiant de manière conceptuelle les contenus de chaque document, un vecteur terme-à-concept est produit pour chaque terme (431 - 438) dans le corpus de documents. Le vecteur terme-à-concept décrit une relation entre le terme (431) et chaque vecteur conceptuel (420 - 424). En fonction des vecteurs terme-à-concept destinés au corpus de documents, une matrice terme-terme est produite décrivant une relation terme-terme entre tous les termes (431 - 438) dans le corpus de documents. La matrice terme-terme peut ensuite est traitée et utilisée pour récupérer des informations à partir du corpus de documents, tel que le fait qu'un premier terme (431) aie une relation avec un second terme (436).</p> |