Proprietes combinatoires des distances d'arbre : algorithmes et applications

par Vladimir Makarenkov

Thèse de doctorat en Mathématiques appliquées aux sciences sociales

Sous la direction de Bruno Leclerc et de Fuad Aleskerov.

Soutenue en 1997

à l'EHESS .


  • Résumé

    La these porte sur l'etude des proprietes combinatoires des distances d'arbre et sur l'utilisation algorithmique des proprietes mises en valeur. Les distances d'arbre ont ete d'abord caracterisees en russie par zaretskii (1965), dans un cas particulier, puis, dans le cas general par buneman (1971). Leur etude a pris son essor dans les annees 80, lorsqu'est apparue la diversite de leurs domaines d'application. Elles ont notamment ete utilisees en theorie des codes, en psychologie cognitive (distances subjectives), en archeologie (filiation de manuscrits), en linguistique (distances entre langues naturelles), en bref, chaque fois qu'un modele de bifurcation peut etre postule ou utilise. Mais c'est d'abord leur usage en biologie genetique, ou elles constituent un modele naturel pour les distances moleculaires ou phylogenetiques, qui motive les nombreux travaux qui leur sont consacres. Une part importante de la litterature sur le sujet concerne les methodes d'ajustement d'une distance d'arbre a un tableau de distances observees (algorithmes et programmes). Pour l'ajustement, les problemes sont en general np-difficiles et les methodes proposees sont heuristiques. Les contributions originales de la these sont de trois types. On a obtenu de nouvelles proprietes combinatoires des distances d'arbre. Ces proprietes sont utilisees pour l'elaboration d'algorithmes originaux pour la reconnaissance et l'ajustement. Enfin, la constitution d'une bibliotheque de programmes en langage c++ incluant ces algorithmes, avec divers programmes d'optimisation et de generation de donnees, permet de les tester sur des donnees d'essai comme sur des donnees reelles. Les performances de ces algorithmes sont egales ou superieures a celles des methodes recentes les plus connues.


  • Résumé

    The thesis is devoted to the combinatorial study of tree metrics, and to the algorithmic uses of the obtained properties. Tree metrics were first characterized in russia by zaretskii (1965) in a particular case, and later, in the general case, by buneman (1971). The interest for their study has considerbly grown in the eighties, when the diversity of their domains of application was perceived. They have been used, for instance, in coding theory, in cognitive psychology (as models for subjective distances), in archaeology (for the filiation of manuscripts), in linguistics (for distances between natural linguages) and, generally, in all situations where a bifurcation model can be postulated or used. In fact, most of the contributions on these metrics are now motivated by their role in phylogenetics, where they constitute a natural model for molecular distances. An important part of the literature on this subject is devoted to the methods (algorithms and programs) for the fitting of a tree metric to an observed distance array. Problems of this type are generally np-hard and the methods are heuristic. The original contributions of the this belong to three types. New combinatorial properties of tree metrics are obtained. These properties are used for the design of original algorithms for the recognition and the fitting of tree metrics. These algorithms are programmed in language c++ and combined with several programs of optimization and generation of data into a program library. Then, it is possible to test our algorithms on real and artificial data. Their performances are at leas good as those of the most known recent methods.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (210 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 75 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : EHESS H 1997 74
  • Bibliothèque : Fondation Maison des sciences de l'homme. Bibliothèque.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.