Thèse soutenue

De l'annotation automatique des génomes à l'annotation experte pour la génomique environnementale

FR  |  
EN
Auteur / Autrice : Philippe Ortet
Direction : Thierry Heulin
Type : Thèse de doctorat
Discipline(s) : Biologie
Date : Soutenance le 25/09/2018
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : Ecole Doctorale Sciences de la Vie et de la Santé (Marseille)
Partenaire(s) de recherche : Laboratoire : LEMIRE. Laboratoire d'ecologie microbienne de la rhizosphère et d'environnements extrêmes (Cadarache)
Jury : Président / Présidente : Jean-Michel Claverie
Examinateurs / Examinatrices : Pascal Simonet, Denis Faure
Rapporteurs / Rapporteuses : Claudine Médigue, Céline Brochier-Armanet

Mots clés

FR  |  
EN

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

À l'époque du démarrage des travaux présentés dans ce document (2003) l’annotation d’un génome était une tâche longue et fastidieuse. Avec l’apparition des nouvelles technologies de séquençage, de nombreux outils ont été développés pour faciliter et accélérer ce processus. Pour les meilleurs, l’annotation d’un génome automatique peut prendre moins de 3 minutes, reportant l’activité chronophage sur l’annotation manuelle. Ainsi, de nombreux génomes sont déposés dans les banques de séquences tels quels sans annotation manuelle experte. Il est donc rapidement apparu nécessaire de fournir aux annotateurs la possibilité d’accéder à des bases de données consolidées et spécifiques de leur domaine d’expertise.Nous présentons dans ce document un outil modulaire d’annotation et de visualisation, GenoBrowser, que nous avons créé dans le cadre de nos travaux de recherche dans une équipe de microbiologie. Celui-ci nous permet d’intégrer simplement de nouvelles fonctionnalités liées aux données de Omics générées dans l’équipe. L’architecture de notre outil et la création d’une API (Application Programming Interface) spécifique nous ont permis de développer et de mettre à la disposition de la communauté scientifique deux bases de données (P2CS et P2TF) dédiées aux réseaux de régulation chez les bactéries, ainsi que le serveur web associé pour la prédiction de ces systèmes pour des génomes séquencés de novo.Ce travail a permis de développer, au sein d’une équipe de recherche, un ensemble d’outils d’aide à l’expertise pour la recherche en génomique environnementale. Il nous a permis de travailler sur la consolidation et la réutilisation de la quantité croissante de données de type Omics.