Apprentissage profond pour le criblage à haut contenu de neurones

par Tiphaine Champetier

Projet de thèse en Génomique

Sous la direction de Auguste Genovesio et de Yong-Jun Kwon.

Thèses en préparation à Paris Sciences et Lettres , dans le cadre de École doctorale Complexité du vivant (Paris) , en partenariat avec Institut de Biologie de l'École Normale Supérieure (laboratoire) et de École normale supérieure (Paris ; 1985-....) (établissement de préparation de la thèse) depuis le 01-09-2016 .


  • Résumé

    D'importants progrès ont été effectués en robotique et en microscopie automatisée ces dix dernières années. Ces progrès sont tels qu'il est à présent possible de préparer des milliers d'échantillons de cellules dont des vésicules ou organelles d'intérêt sont marquées par fluorescence, de les soumettre en parallèle à un grand nombre de perturbations différentes et d'imager les résultats par microscopie de manière totalement automatisée. Aussi, les progrès en analyse d'image dans ce domaine permettent à présent de détecter avec une bonne précision et à haut débit des types cellulaires de morphologie dite « classique » telles que des cellules d'épithélium ou des hépatocytes. En pratique, un crible produit des dizaines de milliers d'images. Les multiples cellules se trouvant sur chacune d'elles peuvent être individuellement décrites par des centaines de descripteurs d'intensité, de forme, de texture ou de relation de voisinage. Notre équipe et d'autres ont montré dans des travaux récents qu'il était possible d'utiliser ces descripteurs cellulaires pour identifier des modulateurs de processus biologiques, des composés à visée thérapeutique ou des gènes impliqués dans des mécanismes d'infection. En revanche, ce type d'analyse hautement automatisé se généralise mal aux cellules neuronales par nature morphologiquement plus complexes et donc plus variables. En effet, cette complexité tend à réduire significativement la précision des techniques de segmentation et donc l'extraction de paramètres nécessaires aux analyses de plus haut niveau. Ce projet de thèse propose d'apporter une solution à ce problème en remplaçant l'étape de segmentation et peut-être l'intégralité du processus de description par des approches d'apprentissage numérique profond (deep learning). Le projet s'articule autour de trois objectifs. Le premier objectif consistera d'une part à étudier les particularités d'un crible de neurones mis au point par notre partenaire Ksilink. Il consistera d'autre part à mesurer les limites des techniques de détection actuelles pour l'analyse d'images de neurones. Le deuxième objectif visera à établir un nouveau paradigme exploitant les méthodes d'apprentissage profond (deep learning) pour la détection, la description et l'analyse de larges données produites par notre partenaire. Enfin, le troisième objectif résidera dans l'analyse effective de cribles visuels à haut débit et l'extraction de candidats pour le développement de thérapies dans le cadre de maladies neuro-dégénératives.

  • Titre traduit

    Deep learning for High Content Screening of neurons


  • Résumé

    Last decade has seen significant progress in robotics and automated microscopy. It is now possible to prepare thousands of cell based samples where vesicles or organelles of interest are labeled by fluorescent dyes. It is also possible to perturb each of those samples with a given compound of a large library and to image the result with a microscope in a fully automated way. Furthermore, image analysis progress in this field now enables high throughput detection and measurement of regular cells, such as epithelial cells or hepatocytes, with good accuracy. In practice, a screen produces tens of thousands of pictures. Every cell on each picture can be individually described by hundreds of features measuring for intensity, shape, texture or neighbor relationships. In recent work, our team and others have shown that it is possible to use those cell features to identify biological process modulators, therapeutic compounds or genes involved in infection mechanisms. However, this type of highly-automated analysis badly generalizes to neuronal cells. Those cells are more complex in nature and hence, more variable. Indeed, this complexity tends to significantly reduce the accuracy of segmentation techniques and, as a consequence, the extraction of quantitative features required for higher-level analysis. This PhD project proposes to bring a solution to that problem. Our goal is to propose a replacement for the segmentation step and perhaps for the whole description process using deep learning approaches. The project articulates around three objectives. The first one consist in studying how a neuronal screening is developed by our partner, Ksilink and evaluate the limits of the current detection techniques in this context. The second objective aims at establishing a new paradigm using deep learning methods for the detection, the description and the analysis of large data produced by our partner. The third objective lies in the actual analysis of high-throughput visual screens and the identification of hits for the development of therapy in the context of neurodegenerative disorders.