Deep learning for computational phenotyping in cell-based assays

par Joseph Boyd

Thèse de doctorat en Bio-informatique

Sous la direction de Thomas Edgar Walter.

Le président du jury était David Rousseau.

Le jury était composé de Thomas Edgar Walter, Auguste Genovesio, Florian Jug, Perrine Paul-Gilloteaux, Véronique Stoven.

Les rapporteurs étaient Charles Kervrann, Anna Kreshuk.

  • Titre traduit

    Apprentissage profond pour le phénotypage computationnel dans les essais cellulaires


  • Résumé

    Le phénotypage computationnel est un ensemble de technologies émergentes permettant d’étudier systématiquement le rôle du génome dans l’obtention de phénotypes, les caractéristiques observables d’un organisme et de ses sous- systèmes. En particulier, les essais cellulaires permettent de cribler des panels de petites molécules ou de moduler l’expression des gènes, et de quantifier les effets sur les caractéristiques phénotypiques allant de la viabilité à la morphologie cellulaire. Le criblage à haut contenu étend les méthodologies des criblages cellulaires à une lecture à haut contenu basée sur des images, en particulier les canaux multiplexés de la microscopie à fluorescence. Les cribles basés sur de multiples lignées cellulaires sont aptes à différencier les phénotypes de différents sous-types d’une maladie, représentant l’hétérogénéité moléculaire concernée dans la conception de thérapies médicales de précision. Ces modèles biologiques plus riches sous-tendent une approche plus ciblée pour le traitement de maladies mortelles telles que le cancer. Un défi permanent pour le criblage à haut contenu est donc la synthèse des lectures hétérogènes dans les cribles à multiples lignées cellulaires. Parallèlement, l’état de l’art établi en matière d’applications d’analyse d’images et de vision par ordinateur est l’apprentissage profond. Cependant, son rôle dans le criblage à haut contenu ne fait que commencer à être réalisé. Cette thèse aborde deux problématiques de l’analyse à haut contenu des lignées cellulaires cancéreuses. Les contributions sont les suivantes : (i) une démonstration du potentiel d’apprentissage profond et de modèles générateurs dans le criblage à haut contenu ; (ii) une solution basée sur l’apprentissage profond au problème de l’hétérogénéité dans un criblage de médicaments sur plusieurs lignées cellulaires ; et (iii) de nouvelles applications de modèles de traduction d’image à image comme alternative à la microscopie à fluorescence coûteuse actuellement nécessaire pour le criblage à haut contenu.


  • Résumé

    Computational phenotyping is an emergent set of technologies for systematically studying the role of the genome in eliciting phenotypes, the observable characteristics of an organism and its subsystems. In particular, cell-based assays screen panels of small compound drugs or otherwise modulations of gene expression, and quantify the effects on phenotypic characteristics ranging from viability to cell morphology. High content screening extends the methodologies of cell-based screens to a high content readout based on images, in particular the multiplexed channels of fluorescence microscopy. Screens based on multiple cell lines are apt to differentiating phenotypes across different subtypes of a disease, representing the molecular heterogeneity concerned in the design of precision medicine therapies. These richer biological models underpin a more targeted approach for treating deadly diseases such as cancer. An ongoing challenge for high content screening is therefore the synthesis of the heterogeneous readouts in multi-cell-line screens. Concurrently, deep learning is the established state-of-the-art image analysis and computer vision applications. However, its role in high content screening is only beginning to be realised. This dissertation spans two problem settings in the high content analysis of cancer cell lines. The contributions are the following: (i) a demonstration of the potential for deep learning and generative models in high content screening; (ii) a deep learning-based solution to the problem of heterogeneity in a multi-cell-line drug screen; and (iii) novel applications of image-to-image translation models as an alternative to the expensive fluorescence microscopy currently required for high content screening.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Paris Sciences et Lettres. Thèses électroniques.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.