Approche de construction d'entrepôts de documents XML

par Ines Ben Messaoud

Thèse de doctorat en Informatique

Sous la direction de Gilles Zurfluh et de Jamel Feki.


  • Résumé

    Les documents constituent une capitalisation importante des connaissances. Généralement, ces documents sont caractérisés par un contenu peu structuré et il est alors difficile de les intégrer dans les systèmes d’information décisionnels. En conséquence, les décideurs ne peuvent pas tirer profit de ces documents. Pour répondre à cette problématique, nous proposons une approche de construction du schéma de l’entrepôt de documents XML. Cette approche se compose de deux méthodes : une méthode d’unification des structures des documents XML et une méthode de modélisation multidimensionnelle de ces documents. La méthode d’unification permet de définir une structure commune pour décrire les documents XML hétérogènes et appartenant au même domaine. Pour valider cette méthode, un outil logiciel baptisé USD (Unification of Structures of XML Documents) est développé. La méthode de modélisation multidimensionnelle a pour but de concevoir semi-automatiquement le schéma du magasin de documents, selon le modèle multidimensionnel en galaxie, à partir d’une structure XML unifiée. Afin de valider cette méthode, un outil nommé Galaxy-Gen (Galaxy Generation) est développé.

  • Titre traduit

    An approach to build XML documents warehouses


  • Résumé

    Documents represent an important knowledge capitalization. In general, these documents are characterized by unstructured content, and therefore it is difficult to integrate them in the decision information systems. As a result, decision-makers are unable to exploit these documents easily and efficiently. To alleviate this problem, we propose an approach to build the schema of the XML documents warehouse. This approach consists of two methods: a method for unification of the structures of XML documents and a method for multidimensional modeling of these documents. The unification method defines a common structure to describe heterogeneous XML documents belonging to the same domain. To validate this method, a software tool called USD (Unification of Structures of XML Documents) is developed. While the method of multidimensional modeling builds semi-automatically the schema of the documents mart as a galaxy model. To validate this method, the tool called Galaxy-Gen (Galaxy Generation) is developed.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université Toulouse 1 Capitole. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.