Contribution à la modélisation de données multi-sources de type DATAWEB basé sur XML

par Ousmane Sall

Thèse de doctorat en Informatique

Sous la direction de Henri Basson, Moussa Lô et de Mary Teuw Niane.

Soutenue en 2010

à Littoral en cotutelle avec l'Université Gaston Berger de Saint-Louis (Sénégal) .


  • Résumé

    Des données de nature environnementale sur la vallée du fleuve Sénégal ont collectées depuis de nombreuses années à partir des activités des différents experts y intervenant. Ces données de nature spatio-temporelle, présentent certaines particularités sémantiques et structurelles selon les partenaires. Des moyens de collecte et de stockage divers sont utilisés, induisant ainsi pour les données une dimension structurelle de l’hétérogénéité à laquelle est apparentée une dimension sémantique liée à leur description. Afin de résoudre la problématique de l’hétérogénéité structurelle, nous avons proposé l’introduction d’une phase préalable de pré-intégration par une représentation de l’ensemble des données partenaires sous XML, constituant ainsi un entrepôt de documents XML dit ici Dataweb. Nous utilisons ensuite le vocabulaire contrôlé décrivant les données de chaque partenaire et la réutilisation d’une ontologie du domaine comme un support pour la construction d’une base de connaissances. Cette base est alors générée partir du dataweb partenaire constituant ainsi un dataweb sémantique. Ce dataweb sémantique permet ainsi l’intégration sémantique et structurelle des données de chaque partenaire. Pour l’intégration entre les différents dataweb sémantiques nous exploitons les travaux développés sur les systèmes à base de hubs en définissant une ontologie avec les concepts que chaque partenaire désire partager et à partir desquels nous constituons une ontologie globale.

  • Titre traduit

    Contribution to XML-based DATAWEB modelisation


  • Résumé

    Environmental data in the Senegal River Valley have been collected for many years from the activities of the various experts and organisms involved therein. These spatio-temporal data display certain specific semantic and structural features depending on the owners. Various systems have been used for the collection and storage of the data, thus, conferring them a structural dimension of heterogeneity, to which a semantic dimension related to them description has been attached, with a proper vocabulary controlled within every organism or expert. In this context, we perform an integration in three phases. First, a structural integration phase, based on the use of XML documents warehouses (called dataweb), allows us to create a warehouse for each agency involved in the project. A second step is to make the integration of these XML documents warehouses by associating a knowledge-base to each warehouse thus constituting semantic dataweb. That is done by an automatic building of OWL ontology starting from XML dataweb and by re-use of the Agricultural Ontology Service. A third mediation phase permits to query in a uniform manner the different semantic dataweb via a web application.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (234 p.)
  • Annexes : Bibliogr. p. 205-214

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université du Littoral-Côte d'Opale (Calais, Pas-de-Calais). Bibliothèque. Section Sciences.
  • Disponible pour le PEB
  • Bibliothèque : Université du Littoral-Côte d'Opale (Calais, Pas-de-Calais). Bibliothèque. Section Sciences.
  • Consultable sur place dans l'établissement demandeur
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.