Détection d'épistasie dans les études d'association pangénomiques avec des techniques d'apprentissage pour l'identification de cibles thérapeutiques

par Lotfi Slim

Projet de thèse en Bio-informatique

Sous la direction de Véronique Stoven et de Chloé-Agathe Azencott.

Thèses en préparation à Paris Sciences et Lettres , dans le cadre de Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique , en partenariat avec Centre de Bio-informatique (laboratoire) et de École nationale supérieure des mines (Paris) (établissement de préparation de la thèse) depuis le 01-10-2016 .


  • Résumé

    L'objectif de cette thèse est (i) de développer de nouvelles approches pour l'identification des interactions multi-locus complexes dans les études GWAS avec des techniques d'apprentissage, par exemple les forêts aléatoires et les réseaux neuronaux profonds, avec une attention particulière portée sur la stabilité des modèles et l'interprétation des résultats, (ii) d'implémenter ces méthodes sur des cartes graphiques (en parallèle si c'est possible) et de les intégrer dans la suite d'outils de Sanofi dédiée aux études GWAS et (iii) finalement, d'appliquer les méthodes développées à des bases de données de maladies complexes avec une importante héritabilité.

  • Titre traduit

    Detection of Epistasis in Genome Wide Association Studies with Machine Learning Methods for Therapeutic Target Identification.


  • Résumé

    The objective of this PhD thesis will be (i) to develop new approaches for identifying complex multi-locus interactions in GWAS using machine learning methods, such as random forests or deep neural networks, focusing in particular on models stability and results interpretability, (ii) to implement these methods on GPU or in parallel when possible, in order to efficiently process large datasets and to integrate the solutions in the current GWAS analysis pipeline at Sanofi , and (iii) to apply these methods to selected datasets for complex diseases with an important estimated heritability.