Un Modèle de spécification de haut niveau pour la transformation de données structurées

par Nouhad Amaneddine

Thèse de doctorat en Informatique

Sous la direction de Jean-Paul Bahsoun.

Soutenue en 2004

à Toulouse 3 .


  • Résumé

    Le développement d'Internet a subi une croissance assez rapide dans les cinq dernières années. Les documents accessibles sont publiés sous forme de pages HTML. Ce format de publication électronique ne sépare pas le contenu du document de sa forme. Le méta langage extensible XML définit un format bien structuré et répond aux exigences des nouvelles technologies, comme la présentation et la gestion des documents Web. XML est devenu une norme et il présente une technologie prometteuse pour la communication et la gestion de l'information. La communauté de l'Internet représentée par le consortium W3C a proposé en 1999 le langage des feuilles de styles extensible XSL. Ce langage est composé de deux parties: le langage XSL-FO pour le formatage des documents en vue de leurs présentations, et le langage XSLT pour la transformation des documents XML. Nous nous intéressons dans cette thèse à la partie transformation du langage XSL. XSLT est un langage plus simple qu'un langage de programmation classique. Il est en lui-même un langage très puissant et accessible au non programmeur. Cependant, il est difficile d'implémenter des règles de transformation complexes en XSLT, et la maintenance du code n'est pas évidente, surtout quand il s'agit d'une longue feuille de style qui manipule des transformations avancées. Comme alternative, nous proposons dans cette thèse un système de spécification des transformations de données structurées appelé TransM. Plusieurs approches de transformation de données structurées sont abordées. Nous présentons leurs avantages et leurs inconvénients ainsi que les plates-formes associées. Un problème que rencontrent les approches actuelles est la difficulté voire l'impossibilité de spécifier une transformation si les structures des documents source et cible sont complètement différentes. Un autre problème se manifeste par leur inaptitude à gérer des transformations sur des documents de structure récursive. Nous avons résolu ces problèmes à l'aide des règles de transformation de TransM. Un domaine d'application connexe bien qu'usuellement séparé dans la littérature est celui de la transformation de modèles. Les problèmes de la récursivité des éléments et de la différence structurelle sont affrontés aussi par les approches de transformation concernées. Pour résoudre ces problème de transformation, il suffit de représenter les modèles dans le format XMI, qui est une représentation XML des modèles, puis d'appliquer les transformations exprimées en TransM sur le document correspondant au format XML. TransM est basé sur un ensemble de règles dont nous définissons la grammaire. Les règles de spécification utilisées sont simples, intuitives et peuvent effectuer non seulement les transformations simples et directes, mais aussi des transformations de structure, point qui n'est pas toujours abordé dans les langages actuellement proposés. Les règles sont définies sur la grammaire des documents. Cette thèse étudie le problème de la transformation de données structurées. Afin de profiter des outils implantant le langage XSLT, le système génère du code XSLT pour accomplir la transformation au niveau des instances. Pour valider notre travail, nous avons développé un prototype de TransM, qui effectue avec succès les transformations avancées voulues.

  • Titre traduit

    A high level specification model for structured document transformation


  • Résumé

    The Internet has presented an increasing development during the last five years. The accessible documents are published under the HTML format. This type of publication does not separate the structure of the document from its content. The extensible meta-language XML has defined a well structured format that responds to the new technologies requirements, like the management and the presentation of Web documents. XML has became an international norm and it presents a promised technology for managing and communicating informations. The Internet community represented by the W3C consortium has proposed in 1999 a new extensible stylesheet language XSL. This language has two parts: the language XSL-FO to formatting documents against their presentation and the second part consists of the XSLT language that has been built for XML document transformations. We are interesting in this thesis by the transformation part of the XSL language XSLT is a transformation language that is more simple than classical programming languages. It has considerable computation power. . .

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 208 f.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. 182-188

Où se trouve cette thèse ?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 2004TOU30195
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.