Une architecture à base d'ontologies pour la gestion unifiée des données structurées et non structurées

by Gayo Diallo

Doctoral thesis in Informatique

Under the supervision of Michel Simonet.

defended on 2006

in Grenoble 1 .

  • Alternative Title

    An ontology-based architecture for the management of structured and unstructured data


  • Abstract not available


  • Abstract

    Les systèmes d'infonnation des organisations contiennent des données de diverses natures, dispersées dans une grande variété de sources. La gestion unifiée pennet d'offrir un accès unifonne et transparent à cet ensemble hétérogène de sources. Nous nous intéressons à l'intégration de données structurées (bases de données relationnelles) et de données non structurées (sources textuelles, pouvant être multilingues) et particulièrement à la prise en compte de sources textuelles dans une infrastructure de gestion unifiée. L'approche que nous proposons repose sur l'utilisation des technologies du Web sémantique et de différents types d'ontologies. Les ontologies servent d'une part à définir le schéma global d'intégration (ontologie globale) et les différentes sources à intégrer. Les ontologies qui représentent les sources à intégrer sont appelées schémas virtuels de sources ou ontologies locales (obtenues par un processus de rétroingénierie). D'autre part, les ontologies pennettent d'effectuer une représentation hybride de chaque source textuelle qui combine des infonnations de catalogage, les vecteurs de tennes, les vecteurs de concepts et, de façon optionnelle, les entités nommées ; tous ces éléments étant identifiés dans chaque document de la source. Nous avons par ailleurs élaboré une approche de gestion conjointe de plusieurs ontologies à travers un serveur d'ontologies qui sert notamment de support à l'interrogation. Un premier domaine d'application de notre travail a été la gestion de données dans le domaine du cerveau. Nous avons construit ou enrichi des ontologies pour l'organisation des connaissances dans ce domaine, utilisées notamment pour la caractérisation sémantique de sources.


  • Abstract

    Organizations' information systems contain different kinds of data, dispersed in several sources. The purpose of the managing heterogeneous data is to offer a transparent access to this set of sources. We are interested in the management of structured (relational databases) and unstructured "multilingual textual sources") data. We especially describe an approach for taking textual sources into account in an integration system. The approach we propose is based on the use of Semantic Web technologies and different kinds of ontologies. Ontologies are used to define the global schema (global ontology) and the sources to be integrated (local ontologies). Local ontologies are obtained in a semi-automatic way using reverse engineering techniques. Ontologies are also used for the hybrid representation oftextual sources. The hybrid representation combines cataloguing infonnation, vectors oftenns and concepts and optionally named entities identified in documents. We have designed and implemented an ontology server to manage multiple ontologies and support queries. A first application domain of our work has been the brain field. We have developed or enriched ontologies for brain knowledge management and semantic characterization.

Consult library

Version is available as a paper

Informations

  • Details : 1 vol. (xvi-157p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 141-157

Where is this thesis?

  • Library : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire Joseph-Fourier.
  • Unvailable for PEB
  • Odds : TS06/GRE1/0241
  • Library : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire Joseph-Fourier.
  • Available for PEB
  • Odds : TS06/GRE1/0241/D
See the Sudoc catalog libraries of higher education and research.