Étude de l'ordre des gènes : clusters de gènes et algorithmique des réarrangements

par Martin Figeac

Thèse de doctorat en Informatique

Sous la direction de Jean-Paul Delahaye et de Jean-Stéphane Varré.

Soutenue en 2004

à Lille 1 .


  • Résumé

    Un des enjeux majeurs de la bioinformatique concerne la génomique comparative. Les approches traditionnelles pour la comparaison de séquences génétiques ne peuvent plus être utilisées lorsqu'on veut traiter des objets biologiques tels que les génomes. Si pour des petits objets, comme les gènes, les mutations qui interviennent au cours de l'évolution sont ponctuelles (insertion, délétion ou substitution d'un nucléotide) ; pour de plus grands objets des événements de réarrangements s'ajoutent: duplications, inversions,transposition de segments de gènes, etc. Nous avons travaillé, dans un premier temps, sur la notion de groupes de gènes communs à plusieurs espèces. On recherche des ensembles de gènes qui conservent la même proximité dans différents génomes. Ces contraintes sur leur conservation supposent une dépendance fonctionnelle. Les définitions existantes étaient trop éloignées de la réalité biologique des génomes et ne permettaient pas d'identifier des résultats intéressants.

  • Titre traduit

    Studying gene order : gene clusters and algorithmic of rearrangements


  • Résumé

    La méthode que nous proposons, basée sur le concept des über-operons, permet non seulement d'identifier des groupes de gènes sur de vraies séquences génomiques, le tout en temps polynomial ; mais elle définit aussi un modèle biologique et fondé de clusters de gènes. En outre, nous montrons comment estimer leur probabilité d'apparition dans des génomes aléatoires. Dans un deuxième temps, nous avons travaillé sur la conservation des groupes de gènes pendant les scénarios évolutifs. L'approche usuelle consiste à inférer un scénario ou à calculer une distance entre deux génomes en comptabilisant les inversions de segments de gènes. La règle adoptée est le principe de parcimonie. Nous avons montré que ces méthodes souffraient d'un manque de vraisemblance dans le cas des inversions de segments de gènes : elles ne respectent pas les groupes de gènes conservés. Nous proposons un nouveau problème où il s'agit de calculer la distance minimum en nombre d'inversions entre deux génomes tout en conservant les groupes de gènes. Nous avons montré que ce problème, contrairement aux autres problèmes similaires ; était NP-complet; nous avons donné son diamètre ; et finalement nous proposons un algorithme de complexité polynomiale en temps sous certaines conditions.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (IV-177 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 173-177. Index

Où se trouve cette thèse ?

  • Bibliothèque : Université des sciences et technologies de Lille (Villeneuve d'Ascq, Nord). Service commun de la documentation.
  • Disponible pour le PEB
  • Cote : 50376-2004-211
  • Bibliothèque : Université des sciences et technologies de Lille (Villeneuve d'Ascq, Nord). Service commun de la documentation.
  • Disponible pour le PEB
  • Cote : 50376-2004-212
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.