Méthodes structurelles et sémantiques pour la mise en correspondance de cas textuels de dysmorphies fœtales

par Yves Jean Vincent Parès

Thèse de doctorat en Informatique médicale

Sous la direction de Marie-Christine Jaulent et de Xavier Aimé.

Soutenue le 01-12-2016

à Paris 6 , dans le cadre de École doctorale Santé publique : épidémiologie et sciences de l'information biomédicale (Paris) , en partenariat avec Laboratoire d'Informatique Médicale et Ingénierie des Connaissances en e-Santé (laboratoire) .

Le jury était composé de Pierre Zweigenbaum, Jean-Marie Jouannic.

Les rapporteurs étaient Isabelle Bichindaritz, Chantal Reynaud.


  • Résumé

    Cette thèse se place dans le contexte d'Accordys, un projet d'ingénierie des connaissances qui vise à fournir un système de rapprochement de cas en fœtopathologie, qui est le domaine de l'étude des maladies rares et dysmorphies du fœtus. Ce projet se base sur un corpus de comptes rendus d'examens fœtaux. Ce matériel consiste en des comptes rendus en texte brut présentant un vocabulaire très spécifique (qui n'est que partiellement formalisé dans des terminologies médicales en français), des économies linguistiques (un style "prise de notes" très prononcé rendant difficile l'utilisation d'outils analysant la grammaire du texte) et une mise en forme matérielle exhibant une structuration commune latente (un découpage en sections, sous-sections, observations). Cette thèse vise à tester l'hypothèse qu'une uniformisation de la représentation des cas exploitant cette structure arborescente en la faisant correspondre à un modèle de cas (lui aussi arborescent) peut supporter la constitution d'une base de cas qui conserve les informations contenues dans les comptes rendus originaux et permette la mesure de similarité entre deux cas. La mise en correspondance entre cas et modèle (instanciation du modèle) est réalisée via un mapping d'arbres ayant pour base une méthode de Monte Carlo. Nous comparerons ceci avec des mesures de similarités obtenues en représentant nos comptes rendus (soit tels quels, soit enrichis sémantiquement grâce à un annotateur sémantique) dans un modèle vectoriel.

  • Titre traduit

    Structural and semantic methods to establish mappings between textual cases of fetal dysmorphia


  • Résumé

    This thesis is set within the context of Accordys, a knowledge engineering project aiming at providing a case-based reasoning system for fetopathology, i.e. the medical domain studying rare diseases and dysmorphia of fetuses. The project is based on a corpus of french fetal exam reports. This material consists in raw text reports diplaying a very specific vocabulary (only partially formalized in french medical terminologies), a "note taking" style that makes difficult to use tools analysing the grammar in the text, and a layout and formatting that shows a latent common structuration (organisation in sections, sub-sections, observations). This thesis aims at testing the hypothesis that a uniformisation of the representation of cases that could exploit this arborescent structure by mapping it with a tree-shaped case model can support the constitution of a case base which preserves the information contained in original reports and the similarity measurement between two cases. Mapping a case with the model (instanciating the case model) is done through a Monte Carlo tree matching method. We compare this with similarity measurements obtained by representing our reports (both without further processing and after semantic enrichment through a semantic annotator) in a vector model.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?