Migration et enrichissement sémantique d’entités culturelles

par Joffrey Decourselle

Thèse de doctorat en Informatique

Sous la direction de Mohand Saïd Hacid et de Nicolas Lumineau.

Soutenue le 28-09-2018

à Lyon , dans le cadre de École doctorale en Informatique et Mathématiques de Lyon , en partenariat avec Université Claude Bernard (Lyon) (établissement opérateur d'inscription) , LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Lyon, Rhône) (laboratoire) et de Base de Données (laboratoire) .

Le président du jury était Karine Zeitouni.

Le jury était composé de Mohand Saïd Hacid, Nicolas Lumineau.

Les rapporteurs étaient Amel Bouzeghoub, Abdelkader Hameurlain.


  • Résumé

    De nombreux efforts ont été faits ces dernières années pour faciliter la gestion et la représentation des entités culturelles. Toutefois, il existe encore un grand nombre de systèmes souvent isolés et encore utilisés dans les institutions culturelles reposant sur des modèles non sémantiques qui rendent difficile la validation et l’enrichissement des données. Cette thèse a pour but de proposer de nouvelles solutions pour améliorer la représentation et l’enrichissement sémantique de données culturelles en utilisant les principes du Web Sémantique. Pour ce faire, la recherche est focalisée d’une part sur l’adoption de modèles plus sémantiques comme selon les principes de FRBR qui permet de représenter des familles bibliographiques complexes en utilisant un modèle entités associations avec différents niveaux d’abstraction. Toutefois, la qualité d’une telle transformation est cruciale et c’est pourquoi des améliorations doivent être faites au niveau de la configuration et de l’évaluation d’un tel processus. En parallèle, la thèse cherche à profiter de ces nouveaux modèles sémantiques pour faciliter l’interconnexion des données avec des sources externes comme celles du Linked Open Data ou des sources moins structurées (Sites Web, Flux). Cela doit permettre de générer des bases de connaissances thématiques plus en accord avec les besoins des utilisateurs. Cependant, l’agrégation d’informations depuis des sources hétérogènes implique des étapes d’alignement à la fois au niveau du schéma et au niveau des entités

  • Titre traduit

    Migration and Semantic Enrichment of Cultural Entities


  • Résumé

    Many efforts have been done these last two decades to facilitate the management and representation of cultural heritage data. However, many systems used in cultural institutions are still based on flat models and are generally isolated which prevents any reuse or validation of information. This Ph.D. aims at proposing new solutions for enhancing the representation and enrichment of cultural entities using the Semantic Web technologies. This work consists in two major steps to reach this objective. On the one hand, the research is focused on the metadata migration process to transform the schema of existing knowledge catalogs to new semantic models. This study is based on a real-world case study using the concepts from the Functional Requirements for Bibliographic Records (FRBR) which allows to generate graph-based knowledge bases. Yet, the quality of such a migration is the cornerstone for a successful adoption. Thus, several challenges related to the tuning and the evaluation of such a process must be faced. On the other hand, the research aims at taking advantage of these semantic models to facilitate the linkage of information with external and structured sources (e.g., Linked Open Data) and extracting additional information from other sources (e.g., microblogging) to build a new generation of thematic knowledge bases according to the user needs. However, in this case, the aggregation of information from heterogeneous sources requires additional steps to match and merge both correspondences at schema and instance level


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Claude Bernard. Service commun de la documentation. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.