Modélisation et requêtes des documents semi-structurés : exploitation de la structure de graphe

par Denis Debarbieux

Thèse de doctorat en Informatique

Sous la direction de Sophie Tison et de Anne-Cécile Caron.

Soutenue en 2005

à Lille 1 .


  • Résumé

    La notion de données semi-structurées est liée au monde Web. On appelle donnée semi-structurée une donnée dont le schéma n'est pas défini a priori. Il peut s'agir d'une page HTML ou d'un site Web tout entier ou encore d'un document XML. Cette thèse étudient les requêtes sur les données semi-structurées modélisées par des graphes. On s'intéresse à différentes représentations des données semi-structurées par des graphes et on considère différents langages de requêtes associés. Un problème différent est étudié pour chaque couple (représentation, langage). Dans le cas des graphes orientés, on utilise des techniques de réécriture et d'automates pour étudier - à des fins d'optimisation de requêtes - les contraintes d'inclusions. Ces contraintes portent sur les chemins qui permettent de naviguer dans la donnée. Pour exploiter l'information liée à la structure d'une donnée, on génère un index qui préserve les contraintes d'inclusions. On étend cette étude pour obtenir le concept de requête graphe. Son intérêt est de permettre la composition de requêtes et de définir celle-ci graphiquement Appliquées au cas des documents "XMLcoloré ", les requêtes graphes permettent d'étudier formellement l'expressivité et la complexité de langages de requêtes inspirés de XPath et de XQuery. Les résultats théoriques sont validés par des expérimentations.

  • Titre traduit

    Model and query of semi structured data : using the graph structure


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (VIII-137 p.)
  • Annexes : Bibliogr. p. 129-136. Index

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Lille. Service commun de la documentation. Lilliad Learning Center Innovation.
  • Disponible pour le PEB
  • Cote : 50376-2005-246
  • Bibliothèque : Université de Lille. Service commun de la documentation. Lilliad Learning Center Innovation.
  • Disponible pour le PEB
  • Cote : 50376-2005-247

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2005LIL10098
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.