Structuration et exploration d'informations génomiques et fonctionnelles des enzymes actives sur les glucides

par Vincent Lombard

Thèse de doctorat en Génomique et Bioinformatique

Sous la direction de Pedro Maldonado Coutinho et de Bernard Henrissat.


  • Résumé

    Les glucides sont très rependus dans la nature et sont impliqués dans une multitude de phénomènes biologiques. Sous forme de saccharides et de glycoconjugués, ils constituent une partie substantielle de la biomasse produite sur terre et représentent une source potentielle d’énergie renouvelable de première importance. La diversité des glucides complexes est créée et contrôlée par un panel d’activités enzymatiques qui interviennent dans leur assemblage, dégradation et modification. L’étude structurale et fonctionnelle des enzymes actives sur les glucides (CAZymes) est à la base de multiples efforts de recherche appliquée en biotechnologie. L’industrie recherche actuellement des enzymes avec des activités et des spécificités encore plus performantes. L’activité de recherche de ces nouvelles enzymes est grandement facilitée par l’accumulation de séquences biologiques dans les bases de données, provenant notamment des études génomiques.Mon sujet de recherche s’inscrit dans un objectif de développement d’outils pour la classification et l’identification de nouvelles enzymes impliqués dans la conversion de la biomasse. Tous ces travaux sont en lien direct avec la mise en place d’une nouvelle infrastructure de la base de données CAZy et l’analyse de données génomiques, métagénomiques et biochimiques. La refonte complète de la structure de la base de données préexistantes et de son interface a été ainsi réalisée. Cet effort a été validé par l’analyse des familles de polysaccharide lyases et la création de sous-familles, dont l’homogénéité fonctionnelle a été révélée. De plus, la détection systématique de protéines modulaires portant des modules d’adhésion aux composants de la paroi végétale a permis l’identification de nouvelles protéines potentiellement impliquées dans la dégradation de la biomasse végétale. Enfin, j’ai implémenté des approches automatisées capables d’analyser de grands volumes de données (méta)génomiques pour en extraire le contenu en CAZymes.

  • Titre traduit

    Structuration and exploration of genomic information and functional enzymes acting on carbohydrate-active enzymes


  • Résumé

    Carbohydrates are widely distributed in nature, where they are involved in a multitude of important biological events. Saccharides and glycoconjugates constitute the main component of the biomass produced on earth, therefore they represent a plentiful source of renewable energy. The diversity of complex carbohydrates is created and controlled by a panel of enzyme activities involved in their assembly, degradation and modification. The structural and functional study of Carbohydrate Active enZymes on (CAZymes) has been the basis for many applied research efforts in biotechnology. For exemple, the biotechnology industry is currently searching enzymes with enhanced activities and specificities. The identification of new enzymes is potentially facilitated by the large-scale accumulation of gene sequences, particularly from current genomic studies.This thesis aimed at developing tools for the classification and identification of new enzymes involved in biomass degradation. To this end, a new structure of the CAZy database was developed and applied to mining genomic, metagenomic and biochemical data. A complete reorganisation of the structure of the existing database and its interface has been achieved. In this effort the analysis of all known families of polysaccharide lyases has been validated and subfamilies were created, which revealed functional homogeneity. In addition, the systematic identification of modular proteins containing plant cell wallbinding modules allowed the identification of new proteins potentially targeting plant biomass. Finally, I show that it is indeed possible to analyze large volumes of (meta)genomic data by automated methods in order to understand their CAZyme contents.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université de Provence. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.