Une approche terminologique pour l'interoperabilite semantique des systemes de bases de donnees heterogenes

par ABDELLATIF SAOUDI

Thèse de doctorat en Sciences appliquées

Sous la direction de Henri Briand.

Soutenue en 1997

à Nantes .

    mots clés mots clés


  • Résumé

    Le besoin de cooperation ou d'interoperabilite des systemes de gestion de bases de donnees (sgbd) heterogenes, distants et autonomes constitue un defi majeur dans les systemes d'information d'aujourd'hui. Cette these s'inscrit dans cette optique et contribue a l'interoperabilite des sgbd relationnels et orientes objet (oo) dans le cadre d'une architecture federee. Ce travail est centre sur l'etude des deux etapes les plus importantes de la construction d'une base de donnees federee a savoir la traduction et l'integration de schemas. Nous utilisons le modele de donnees fourni par le systeme terminologique back comme une representation intermediaire (modele pivot) dans la federation. La traduction des schemas relationnels se fait selon un processus d'enrichissement semantique qui vise a decouvrir les semantiques disseminees dans les schemas et les donnees afin de les exprimer dans le schema terminologique cible. En effet, nous proposons des algorithmes pour l'inference des dependances d'inclusion et d'exclusion qui constituent le noyau de l'etape de conversion des schemas relationnels. Nous proposons egalement l'utilisation d'un indice statistique qui permet de transformer certaines dependances de recouvrement en dependances d'inclusion. La presence des valeurs nulles dans la base de donnees relationnelle et leur repercussion sur l'enrichissement du schema cible est aussi etudiee. La traduction des schemas oo, quant a elle, se fait a l'aide de regles de transformation syntaxiques vu la convergence des deux modeles de donnees (oo et back). L'integration des schemas terminologiques obtenus est effectuee en identifiant tout d'abord les correspondances structurelles inter-schemas (exprimees sous forme d'assertions). Nous proposons un algorithme pour le controle de coherence des correspondances identifiees et pour l'inference des correspondances manquantes. Ensuite, nous appliquons un ensemble de regles d'integration adapte a chaque type de correspondance. Enfin, l'utilisation d'un systeme terminologique permet de beneficier de ses capacites de classification automatique dans la restructuration du schema federe final (elimination des redondances).


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 162 P.
  • Annexes : 145 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 97 NANT 2091
  • Bibliothèque : Université de Nantes. Service commun de la documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 97 NANT 2091
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.