Dépendances fonctionnelles : extraction et exploitation

par Eve Garnaud

Thèse de doctorat en Informatique

Sous la direction de Mohamed Mosbah et de Sofian Maabout.

Le président du jury était Olivier Beaumont.

Le jury était composé de Farid Cerbah.

Les rapporteurs étaient Anne Doucet, Jean-Marc Petit.


  • Résumé

    Les dépendances fonctionnelles fournissent une information sémantique sur les données d’une table en mettant en lumière les liens de corrélation qui les unient. Dans cette thèse, nous traitons du problème de l’extraction de ces dépendances en proposant un contexte unifié permettant la découverte de n’importe quel type de dépendances fonctionnelles (dépendances de clé, dépendances fonctionnelles conditionnelles, que la validité soit complète ou approximative). Notre algorithme, ParaCoDe, s’exécute en parallèle sur les candidats, réduisant ainsi le temps global de calcul. De ce fait, il est très compétitif vis-à-vis des approches séquentielles connues à ce jour. Les dépendances satisfaites sur une table nous servent à résoudre le problème de la matérialisation partielle du cube de données. Nous présentons une caractérisation de la solution optimale dans laquelle le coût de chaque requête est borné par un seuil de performance fixé préalablement et dont la taille est minimale. Cette spécification de la solution donne un cadre unique pour décrire et donc comparer formellement les techniques de résumé de cubes de données.

  • Titre traduit

    Functional dependencies : extraction and exploitation


  • Résumé

    Functional dependancies provide a semantic information over data from a table to exhibit correlation links. In this thesis, we deal with the dependancy discovery problem by proposing a unified context to extract any type of functional dependencies (key dependencies, conditional functional dependencies, with an exact or an approximate validity). Our algorithm, ParaCoDe, runs in parallel on candidates there by reducing the global time of computations. Hence, it is very competitive comparated to sequential appoaches known today. Satisfied dependencies on a table are used to solve the problem of partial materiali-zation of data cube. We present a characterization of the optimal solution in which the cost of each query is bounded by a before hand fixed performance threshold and its size is minimal. This specification of the solution gives a unique framework to describe and formally compare summarization techniques of data cubes.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?