La maintenance des annotations sémantiques

par Silvio domingos Cardoso

Projet de thèse en Informatique

Sous la direction de Chantal Reynaud et de Cédric Pruski.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec LRI - Laboratoire de Recherche en Informatique (laboratoire) , LaHDAK - Données et Connaissances Massives et Hétérogènes (equipe de recherche) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2015 .


  • Résumé

    Sujet de thèse de doctorat L'utilisation de ressources termino-ontologiques (RTO) comme les ontologies, a montré une grande utilité pour traiter l'interopérabilité sémantique dans les systèmes d'information du domaine de la santé. Les éléments de ces RTOs servent à annoter diverses informations et données dans le but de les rendre compréhensible par les ordinateurs et faciliter leur exploitation. Cependant, la dynamique du domaine de la santé pousse à une constante révision du contenu des RTOs existantes remettant ainsi en cause la validité des annotations sémantiques associées aux données. Cette thèse s'intéresse donc à la maintenance des annotations sémantiques rendues invalides du point de vue de la sémantique par l'évolution des RTOs. Le travail à réaliser est le suivant : 1. Comprendre le principe d'évolution des RTOs et son impact sur les annotations sémantiques, 2. Proposer un algorithme permettant de maintenir la validité sémantique des annotations sémantiques en tenant compte de l'évolution des RTOs. Deux cas seront considérés : a. Une modification directe des annotations dans le cadre où ces dernières seraient directement accessibles b. Une modification ad-hoc à travers la proposition d'un langage de requête intégrant l'évolution des RTOs permettant aux données annotées de rester accessible en dépit d'une incohérence entre les données et les annotations. L'approche développée par le doctorant sera évaluée sur des cas d'études concrets empruntés au domaine de la santé à savoir, les annotations sémantiques des données des patients et celles des cahiers d'observation lors d'étude clinique. Contexte de travail: Le travail s'inscrit dans le cadre du projet de recherche ELISA financé par le Fonds National de la Recherche Luxembourgeois (FNR). Le candidat sera intégré dans l'équipe ADAPT du Luxembourg Institute of Science and Technology (LIST) et de l'équipe LahDAK du Laboratoire de Recherche en Informatique (LRI) de l'université Paris-Saclay.

  • Titre traduit

    Semantic annotations maintenance process


  • Résumé

    The use of Knowledge Organizing Systems (KOS) like ontologies in the medical field has show great possibilities to tackle semantic interoperability issues. In many cases, KOS elements serve to annotate information in order to make their semantics explicit for machines, which facilitate the automatic treatment, and in particular, the retrieval of the annotated information. However, the medical domain is highly dynamic by nature. Since 50% of the knowledge of this field is renewed every 10 years [1], the content of KOS, representing this knowledge, has to smoothly follow the evolution of the domain to remain exploitable by underlying software applications. As a consequence, the modifications made in these KOS, based on domain evolution, must also be propagated to all elements that depend on the KOS [2, 3]. This is the case for semantic annotations. In this PhD project the aim is to design a formal framework for the (semi-)automatic maintenance of semantic annotations. The PhD work will reside in (i) understanding the quality of annotations through manual and automatic annotation processes (ii) identifying and characterizing the evolution occurring in KOS and in (iii) exploiting this information to define algorithms to maintain semantic annotations affected by KOS evolution. Moreover, two maintenance scenarios will be distinguished: (i) direct migration of the annotation in the case where those are modifiable and (ii) an ad-hoc migration process in the case where annotations are not modifiable. In the latter, the goal it to ensure that annotated data are still searchable. The proposed approach will be validated on real case studies consisting in the maintenance of semantic annotations attached to Electronic health records and Case Report Forms. Context of work: This PhD project will take place in the framework of the ELISA international research project funded by the Fonds National de la Recherche Luxembourg. The candidate will work in the ADAPT team of the Luxembourg Institute of Science and Technology and in the Lahdak team of the LRI from University Paris-Sud.