Analyses et méthodes pour les données transcriptomiques issues d’espèces non modèles : variation de l’expression des éléments transposables (et des gènes) et variants nucléotidiques

par Helene Lopez-maestre (Lopez)

Projet de thèse en Bioinformatique

Sous la direction de Cristina Vieira-Heddi.

Thèses en préparation à Lyon , dans le cadre de École Doctorale Evolution Ecosystèmes Microbiologie Modélisation , en partenariat avec Biométrie et Biologie Evolutive (equipe de recherche) depuis le 30-09-2013 .


  • Résumé

    Le développement de la seconde génération de séquenceurs haut débit a généralisé l'accès à l'étude du transcriptome via le protocole RNA-seq. Celui-ci permet d'obtenir à la fois la séquence et l'abondance des transcrits d'un échantillon. De nombreuses méthodes bioinformatiques ont été et sont encore développées pour permettre l'analyse des données issues du RNA-seq et en tirer le maximum d'information. Ce type d'analyse est notamment possible sans utiliser de génome de référence, et donc pour les espèces modèles ou non-modèles, grâce à des méthodes d'assemblage. Durant ma thèse, j'ai principalement travaillé à partir de données RNA-seq issues d'espèces non modèles. Je me suis intéressée dans un premier temps à l'impact de l'hybridation inter spécifique sur la stabilité des génomes chez les hybrides issus des croisements réciproques de D. mojavensis et D. arizonae. Nos résultats ne montrent pas une dérégulation globale, mais plutôt quelques gènes et éléments transposables qui sont spécifiquement dérégulés. La pipeline d'analyse mis en place ici sera réutilisée pour l'étude des niveaux d'expression des transcrits chez les mâles ainsi que pour les croisements issus d'autres lignées de D. mojavensis avec D. arizonae, conduisant à une fertilité variable chez les hybrides. Dans un second temps, j'ai participé à la validation du logiciel KisSplice pour la détection de SNP dans des données RNA-seq sans génome de référence. Celui-ci permet de trouver différents types de variants (épissage, indels) directement dans le graphe de de Bruijn construit à partir des lectures séquencées. J'ai également participé au développement d'outils de post-traitement permettant de prédire l'impact des SNP sur les protéines.

  • Titre traduit

    Analyses and methods for RNAseq data from non model species : variation in transposable elements (and genes) expression and detection of single nucleotide variants


  • Pas de résumé disponible.