摘要 |
<p>L'invention concerne un système et un procédé qui compriment efficacement des contenus d'un système de base de données et permettent des interrogations ad hoc et des interrogations globales de type OLAP. L'invention consiste en une nouvelle représentation comprimée du cube de données qui: a) diminue radicalement la capacité de mémoire requise, b) n'impose pas de définir à l'avance la hiérarchie de discrétisation accompagnant chaque dimension d'interrogation; et c) traite chaque dimension comme une mesure cible potentielle, et comporte de multiples fonctions d'agrégation n'induisant pas de coûts de stockage supplémentaires. Le compromis se traduit par des réponses aux interrogations approximatives mais relativement précises. La méthode de base consiste à représenter les contenus de la base de données par une distribution théorique constituée d'un mélange de gaussiens. Les interrogations d'agrégation, qu'elles soient multidimensionnelles, conjonctives ou disjonctives, peuvent recevoir une réponse par la superposition d'une intégration sur la distribution théorique. On augmente le modèle de base avec un ensemble de rangées aberrantes (éventuellement comprimées) provenant des données, afin d'améliorer davantage la précision, si une plus grande quantité de mémoire système est disponible pour cette tâche.</p> |