Analyses des composantes lymphoïdes dans les données de RNAseq de tumeurs humaines

par David Brandao

Projet de thèse en Aspects moléculaires et cellulaires de la biologie

Sous la direction de Olivier Bernard et de Daniel Gautheret.

Thèses en préparation à Paris Saclay , dans le cadre de Cancérologie : biologie - médecine - santé , en partenariat avec Hématopoïèse normale et pathologique (laboratoire) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2015 .


  • Résumé

    Les remaniements somatiques des gènes des immunoglobulines (IG) et du récepteur à l'antigène des lymphocytes T (TCR) sont une étape importante et spécifique de la différenciation lymphoïde. Les remaniements du TCR et des IG résultent de la juxtaposition par délétion de segments d'ADN séparés sur l'ADN germinal. De plus, ces remaniements sont accompagnés par l'addition sans matrice de nucléotides et dans le cas des immunoglobulines, de mutations somatiques supplémentaires visant à augmenter encore l'affinité pour l'antigène. La diversité générée par ces remaniements permet donc de produire des protéines interagissant avec virtuellement tous les épitopes possibles. En accord avec leur fonction, les lymphocytes sont recrutés aux sites de réactions immunitaires, contre des agents infectieux mais aussi dans le cadre de réactions antitumorales naturelles ou induites. Elle constitue également un marqueur de clonalité qui est recherché en routine dans les laboratoires hospitaliers, pour confirmer le caractère tumoral d'une prolifération lymphocytaire. Les analyses par séquençage à fins de recherche et, de plus en plus, à visée cliniques, utilisent maintenant des techniques de type Next Generation Sequencing (NGS) qui déterminent de façon massive la séquence nucléotidique de petits fragments d'ADN. Le point délicat de l'analyse de ces données très volumineuses est l'alignement sur le génome et la détection des variations de séquence. Les remaniements du TCR et des IG posent des problèmes particuliers du fait même de leur diversité. Le sujet de thèse proposé ici se situe à l'interface entre l'hématologie, la cancérologie et la bioinformatique. Des algorithmes récents permettent d'identifier et de quantifier les remaniements des IG ou du TCR à partir de séquençage ADN ciblé. Nous proposons d'adapter ces algorithmes à l'analyse de données de type RNA-seq (séquençage NGS d'ARN) qui sont aujourd'hui produites massivement à de tumeurs hématopoietiques et de tumeurs solides. Notre outil permettra d'estimer directement à partir des données RNA-seq le degré de clonalité d'une prolifération lymphoïde et de quantifier la présence de populations lymphocytaires dans des échantillons de tumeur solides. L'intégration de ces profils TCR/IG et des signatures transcriptionnelles très fines fournies par le RNA-seq procurerait un niveau de description inégalé de la population de cellules tumorales.

  • Titre traduit

    Investiagtion of lymphoide componant in RNAseq from human tumors


  • Résumé

    Somatic rearrangements of immunoglobulin (IG) and T cells antigen receptor (TCR) genes are an important and specific stage of lymphoid differentiation. Rearrangement of TCR and Ig result of the juxtaposition by deletion of DNA segments separated on the germinal DNA. Moreover, these rearrangements are associated with addition of non-templated nucleotides. In immunoglobulin genes, additional somatic mutations may further increase antigenic affinity. Therefore the diversity generated by these alterations allow for synthesis of proteins that interact with virtually all possible epitopes. Consistent with their function, the cells are recruited to the immune responses sites against infectious agents but also in the context of natural or induced antitumor responses. These somatic rearrangements are also a marker of clonality routinely investigated in clinical laboratories, to confirm the tumor nature of a lymphoid proliferation. Massive paralell sequencing approches (Next Generation Sequencing: NGS) are increasingly used in clinical settings. The analyses of TCR and Ig rearrangements is challenging in humans because of their diversity. The present thesis project lies at the interface between hematology, oncology and bioinformatics. Recent algorithms identifying and quantifying Ig or TCR rearrangement from targeted DNA sequencing have been developped. We propose to adapt these algorithms to the analysis of RNA-seq data type (NGS sequencing RNA), which are now produced massively in hematopoietic tumors and solid tumors. Our tool will estimate directly from the RNA-seq data the degree of clonality of a lymphoid proliferation and quantify the presence of lymphocyte populations in solid tumor samples. The integration of these profiles TCR / IG and very fine transcriptional signatures provided by the RNA-seq would provide an unparalleled level of description of the tumor bulk including hematopoietic cell sub population.