Une architecture à base d'ontologies pour la gestion unifiée des données structurées et non structurées

par Gayo Diallo

Thèse de doctorat en Informatique

Sous la direction de Michel Simonet.

Soutenue en 2006

à l'Université Joseph Fourier (Grenoble) .


  • Résumé

    Les systèmes d'infonnation des organisations contiennent des données de diverses natures, dispersées dans une grande variété de sources. La gestion unifiée pennet d'offrir un accès unifonne et transparent à cet ensemble hétérogène de sources. Nous nous intéressons à l'intégration de données structurées (bases de données relationnelles) et de données non structurées (sources textuelles, pouvant être multilingues) et particulièrement à la prise en compte de sources textuelles dans une infrastructure de gestion unifiée. L'approche que nous proposons repose sur l'utilisation des technologies du Web sémantique et de différents types d'ontologies. Les ontologies servent d'une part à définir le schéma global d'intégration (ontologie globale) et les différentes sources à intégrer. Les ontologies qui représentent les sources à intégrer sont appelées schémas virtuels de sources ou ontologies locales (obtenues par un processus de rétroingénierie). D'autre part, les ontologies pennettent d'effectuer une représentation hybride de chaque source textuelle qui combine des infonnations de catalogage, les vecteurs de tennes, les vecteurs de concepts et, de façon optionnelle, les entités nommées ; tous ces éléments étant identifiés dans chaque document de la source. Nous avons par ailleurs élaboré une approche de gestion conjointe de plusieurs ontologies à travers un serveur d'ontologies qui sert notamment de support à l'interrogation. Un premier domaine d'application de notre travail a été la gestion de données dans le domaine du cerveau. Nous avons construit ou enrichi des ontologies pour l'organisation des connaissances dans ce domaine, utilisées notamment pour la caractérisation sémantique de sources.


  • Pas de résumé disponible.

  • Titre traduit

    ˜An œontology-based architecture for the management of structured and unstructured data


  • Résumé

    Organizations' information systems contain different kinds of data, dispersed in several sources. The purpose of the managing heterogeneous data is to offer a transparent access to this set of sources. We are interested in the management of structured (relational databases) and unstructured "multilingual textual sources") data. We especially describe an approach for taking textual sources into account in an integration system. The approach we propose is based on the use of Semantic Web technologies and different kinds of ontologies. Ontologies are used to define the global schema (global ontology) and the sources to be integrated (local ontologies). Local ontologies are obtained in a semi-automatic way using reverse engineering techniques. Ontologies are also used for the hybrid representation oftextual sources. The hybrid representation combines cataloguing infonnation, vectors oftenns and concepts and optionally named entities identified in documents. We have designed and implemented an ontology server to manage multiple ontologies and support queries. A first application domain of our work has been the brain field. We have developed or enriched ontologies for brain knowledge management and semantic characterization.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (xvi-157p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 141-157

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS06/GRE1/0241
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS06/GRE1/0241/D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.