Thèse soutenue

Analyse de l'hétérogénéité phénotypique et spatiale des cellules à partir de grandes données de microscopie

FR  |  
EN
Auteur / Autrice : France Rose
Direction : Auguste Genovesio
Type : Thèse de doctorat
Discipline(s) : Biologie cellulaire
Date : Soutenance le 18/10/2019
Etablissement(s) : Paris Sciences et Lettres (ComUE)
Ecole(s) doctorale(s) : École doctorale Complexité du vivant (Paris)
Partenaire(s) de recherche : Laboratoire : Institut de biologie de l'École normale supérieure (Paris ; 2010-....)
établissement de préparation de la thèse : École normale supérieure (Paris ; 1985-....)
Jury : Président / Présidente : Priscille Brodin
Examinateurs / Examinatrices : Auguste Genovesio, Priscille Brodin, Berend Snijder, Thierry Feuillet, Thierry Dorval, Chloé-Agathe Azencott
Rapporteurs / Rapporteuses : Berend Snijder

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

La robotique et l’automatisation des microscopes ont ouvert la voie aux cribles cellulaires à haut contenu : des marqueurs fluorescents ciblant l’ADN ou d’autres composants sont utilisés pour imager des centaines de milliers de cellules dans différentes conditions. Il a été montré que les cribles cellulaires sont efficaces pour découvrir des médicaments de nouvelles classes thérapeutiques, cad ceux qui agissent sur une nouvelle cible. Les cribles permettent d’identifier des composés prometteurs et de les caractériser en leur associant des annotations fonctionnelles, comme leur cible moléculaire ou leur mécanisme d’action (MOA).J’ai étudié l'hétérogénéité des réponses cellulaires à différents niveaux et comment cette hétérogénéité phénotypique peut être exploitée pour mieux caractériser les composés. Au premier niveau, j’ai étudié l'hétérogénéité entre patients. Nous avons montré qu’utiliser différentes lignées cellulaires dérivées de patients augmente la probabilité de prédire la cible moléculaire du composé testé. Le second niveau correspond à la diversité des réponses cellulaires de la même lignée cellulaire soumise au même traitement. Des méthodes de clustering appropriées peuvent être utilisées pour clarifier cette complexité et pour grouper les cellules en sous-populations. Les proportions de chaque sous-population par traitement permettent de prédire le bon MOA. Le troisième niveau regarde comment les sous-populations cellulaires sont organisées spatialement. J’ai trouvé que les cellules voisines s’influencent les unes les autres et affichent un phénotype similaire plus fréquemment qu’attendu par chance. Ces résultats obtenus sur une centaine de traitements montrent que des cellules génétiquement identiques ne sont pas identiques et indépendantes mais sont à l’origine d’une hétérogénéité spatiale par le lignage cellulaire et les interactions. En utilisant l’information spatiale ainsi que l'hétérogénéité phénotypique, les méthodes à noyaux de graphes améliorent la classification en MOA sous certaines conditions. Parallèlement, comme l’analyse spatiale peut s’appliquer à n’importe quelle image de microscopie, j’ai développé une librairie d’analyse Python, PySpacell, pour étudier l’aléatoire spatial de marqueurs quantitatifs et qualitatifs.