Développement d'une infrastructure d'analyse multi-niveaux pour la découverte des relations entre génotype et phénotype dans les maladies génétiques humaines

par Tien Dao Luu

Thèse de doctorat en Bioinformatique

Sous la direction de Olivier Poch.

Le président du jury était Gilbert Deleage.

Le jury était composé de Jean-Daniel Zucker, Nicolas Lachiche.

Les rapporteurs étaient Marie-Dominique Devignes.


  • Résumé

    Répondant au besoin de mieux comprendre les relations qui lient un génotype aux phénotypes moléculaires et cliniques associés, nous avons développé une nouvelle infrastructure bioinformatique qui unit, dans un même système, la collecte, la gestion, la maintenance et le traitement de multiples données ou informations. La première contribution de cette thèse est SM2PH Central et sa capacité de générer des instances. SM2PH Central constitue notre centre de référence en ligne pour toutes les protéines humaines intégrant des niveaux d’informations qui vont des aspects génomiques, structuraux, fonctionnels ou évolutifs aux aspects de transcriptomique, interactomique, protéomique ou métabolomique. La deuxième contribution est MSV3d, une ressource d’annotation multi-niveau (propriétés physico-chimiques, fonction, évolution, structure) des mutations humaines connues. MSV3d fournit l’ensemble des connaissances exploitées par la troisième contribution de cette thèse à savoir KD4v, notre base d’extraction de connaissances pour prédire l’impact phénotypique d’une mutation. La base de connaissances de KD4v induite par la Programmation Logique Inductive contient des règles exploitables par un humain ou un ordinateur et des facteurs prédictifs caractérisant les mutations neutres ou délétères. Enfin, l’ultime contribution de cette thèse est liée au développement de GEPeTTO, un prototype de priorisation de gènes. Une application biologique a été réalisée. Nous avons étudié la cécité nocturne en utilisant SM2PH Central, en combinaison avec le service d’annotation de MSV3d et la méthode de prédiction KD4v pour analyser le gène GPR179 et ses deux mutations nouvellement identifiées.

  • Titre traduit

    Development of an infrastructure for multi-level analysis to explore the relationship between genotype in human genetic diseases


  • Résumé

    Responding to the need to better understand the relationships linking the genotype to the molecular and clinical phenotype, we have developed a new bioinformatics infrastructure that unites, in a single system, the collection, the management, the maintenance and the processing of multiple data or information. The first contribution of this thesis is SM2PH Central and its ability to generate instances. SM2PH Central is our online reference center for all human proteins including many levels of information such as genomics, structural, functional and evolutionary aspects of transcriptomics, interactomics, proteomics or metabolomics. The second contribution is MSV3d, a multi-level annotation resource (physico-chemical properties, function, evolution, structure) of known human mutations. MSV3d provides the knowledge used by the third contribution of this thesis namely KD4v, our knowledgebase extraction to predict the phenotypic effect of a mutation. The KD4v knowledgebase computed by Inductive Logic Programming contains the rules describing the information that can be either exploited by a human or a computer, and the predictors characterizing neutral or deleterious mutations. The last contribution of this thesis is related to the development of GEPeTTO, a prototype of the prioritization of genes. Finally, these tools (SM2PH Central, MSV3d, KD4v) allowed us in the context of patients data analysis to confirm the implication of GPR179 as a new gene responsible for congenital stationary night blindness.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université de Strasbourg. Service commun de la documentation. Bibliothèque électronique 063.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.