摘要 |
<p>Le procédé de découverte d'un ensemble de sources définissant des pages WEB comprend :•une définition d'un profil utilisateur comprenant :○une liste d'adresses URL définissant chacune une graine;○un index de profil ;•une collecte d'un ensemble de données de chaque page désignée par une URL de la graine, la collecte comprenant :○une définition d'un ensemble de mots clefs ;○une attribution d'au moins un indice de pertinence ;○une indexation de chaque mot clef dans l'index de profil ;•une collecte des URL de chaque page WEB explorée ;•une attribution d'un niveau de pertinence à chaque page collectée;•un calcul d'un indice de priorité d'exploration de chaque URL;•une création d'une liste ordonnée d'URL selon leur indice de priorité d'exploration ;•un choix d'une nouvelle URL pour explorer automatiquement une nouvelle page WEB.</p> |