Nouvelles heuristiques de voisinage et mémétiques pour le problème Maximum de Parcimonie

par Adrien Goëffon

Thèse de doctorat en Informatique

Sous la direction de Jin-Kao Hao.

Soutenue en 2006

à Angers .


  • Résumé

    La reconstruction phylogénétique vise à reconstituer l'histoire évolutive d'un ensemble d'espèces sous forme d'un arbre. Parmi les méthodes de reconstruction, le problème Maximum de Parcimonie (MP) consiste à trouver un arbre binaire dont les feuilles sont associées à des séquences de caractères données, et qui minimise le score de parcimonie. Les méthodes de résolution existantes de ce problème NP-complet s'attachent généralement à appliquer des méthodes heuristiques traditionnelles, comme des algorithmes gloutons et de recherche locale. L'une des diffcultés du problème repose sur la manipulation d'arbres et la définition de voisinages d'arbres. Dans cette thèse, nous nous intéressons en premier lieu à l'amélioration des techniques de résolution du problème MP basées sur un algorithme de descente. Après avoir montré de manière empirique les limites des voisinages existants, nous introduisons un voisinage progressif qui évolue au cours de la recherche afin de limiter l'évaluation de voisins infructueux lors d'une descente. L'algorithme obtenu est ensuite hybridé à un algorithme génétique utilisant un croisement d'arbres spécifique fondé sur les mesures de distance entre chaque couple d'espèces dans l'arbre. Cet algorithme mémétique exhibe des résultats très compétitifs, tant sur des jeux de test tirés de la littérature que sur des jeux générés aléatoirement.


  • Résumé

    Phylogenetic reconstruction aims at reconstructing the evolutionary history of a set of species, represented by a tree. Among the reconstruction methods, the Maximum Parsimony (MP) problem consists, given a set of aligned sequences to find a binary tree, whose leaves are associated to the sequences and which minimizes the parsimony score. Traditionally, existing resolution approaches of this NP-complete problem apply basic heuristic methods, like greedy algorithms and local search. One of the difficulties concerns the handling of binary trees and the definition of tree neighborhoods. In this thesis, we first focus on an improvement of descent algorithms. We empirically show the limits of the existing tree neighborhoods, and introduce a progressive neighborhood which evolves during the search to limit the evaluation of inappropriate neighbors. This algorithm is combined with a genetic algorithm which uses a specific tree crossover based on topological distances between each pair of leaves. This memetic algorithm shows very competitive results, both on real benchmarks taken from the literature as well as with randomly generated instances.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (xi-142 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 125-140

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Angers. Service commun de la documentation. Section Lettres - Sciences.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.