Thèse soutenue

Bioinformatique pour l’exploration de la diversité inter-espèces et inter-populations : hétérogénéité & données multi-omiques
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Yannick Cogne
Direction : Jean ArmengaudChristine Almunia
Type : Thèse de doctorat
Discipline(s) : Biologie Santé
Date : Soutenance le 07/10/2019
Etablissement(s) : Montpellier
Ecole(s) doctorale(s) : Sciences Chimiques et Biologiques pour la Santé (Montpellier ; Ecole Doctorale ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Innovations technologiques pour la Détection et le Diagnostic
Jury : Président / Présidente : Jacques Colinge
Examinateurs / Examinatrices : Jean Armengaud, Christine Almunia, Christine Carapito, Ana Maria Varela Coelho, Michel Hébraud
Rapporteurs / Rapporteuses : Christine Carapito, Ana Maria Varela Coelho

Résumé

FR  |  
EN

L’exploitation conjointe des données transcriptomiques et protéomiques permet l’étude détaillée des mécanismes moléculaires induits lors de perturbations environnementales. L’assemblage de données issues du séquençage des ARNs d’organismes dit « non-modèle » permet de produire la base de données pour l’interprétation des spectres générés en protéomique shotgun. Dans ce contexte, les travaux de thèse avaient pour objectif d’optimiser l’interprétation et l’analyse des données protéomiques par le développement de concepts innovants pour la construction de bases de données protéiques et l’exploration de la biodiversité. La première étape s’est concentrée sur la mise au point d’une méthode de pré-traitement des données de séquençage basée sur les résultats d’attribution protéomique. La deuxième étape a consisté à travailler sur la réduction de la taille des bases de données en optimisant les paramètres de la recherche automatisée des régions codantes. La méthode optimisée a permis l’analyse de 7 groupes taxonomiques de Gammaridés représentatifs de la diversité retrouvée in natura. Les bases de données protéomiques ainsi produites ont permis l’analyse inter-population de 40 protéomes individuels de Gammarus pulex répartis sur deux sites de prélèvement (pollué vs référence). L’analyse statistique basée sur une approche « individu-centré » a montré une hétérogénéité de la réponse biologique au sein d’une population d’organismes suite à une perturbation environnementale. Différents sous-groupes de mécanismes moléculaires induits ont été identifiés. Enfin, l’étude de la transversalité de biomarqueurs peptidiques identifiés chez Gammarus fossarum a permis de définir les peptides communs à l’aide de l’ensemble des données protéomiques et transcriptomiques. Pour cela, un logiciel d’exploration des séquences peptidiques a été développé permettant de proposer de potentiels biomarqueurs substituts dans le cas où les peptides définis ne sont pas applicables à certaines espèces de gammare. Tous ces concepts s’intègrent dans une démarche pour améliorer et approfondir l’interprétation des données par protéogénomique. Ces travaux entrouvrent la porte à l’analyse multi-omique d’individus prélevés in natura en considérant la biodiversité inter-espèce et intra-population.