Combinaison de classifieurs statistiques, application a la prediction de la structure secondaire des proteines

par Yann Guermeur

Thèse de doctorat en Sciences biologiques et fondamentales appliquées. Psychologie

Sous la direction de Patrick Gallinari.

Soutenue en 1997

à Paris 6 .

    mots clés mots clés


  • Résumé

    La combinaison de modeles a permis ces dernieres annees des avancees significatives dans le domaine de l'apprentissage statistique, que ce soit en regression ou en reconnaissance des formes. Cependant, des questions essentielles sont demeurees pratiquement inexplorees. Ainsi, les criteres gouvernant le choix d'une methode particuliere sont mal definis et l'effet de la combinaison en discrimination n'a pas ete specifiquement mis en evidence. Cette these porte sur l'une des techniques de combinaison les plus utilisees : la regression lineaire. Dans un premier temps, nous caracterisons l'effet regularisant de la methode de stacked regression introduite par breiman. Nous etudions ensuite l'application du modele de regression lineaire multivariee au probleme de la combinaison d'experts discriminants estimant les probabilites a posteriori des classes. Cette question est traitee successivement sous l'angle de l'optimisation puis du controle de la complexite. La capacite du modele est mesuree au moyen de definitions generalisees de la dimension de vapnik-chervonenkis. L'etude se poursuit avec la presentation d'une methode non parametrique d'estimation de l'erreur de bayes. Notre modele de combinaison est evalue sur un probleme ouvert en traitement de sequences biologiques : la prediction de la structure secondaire des proteines globulaires. Pour realiser cette tache de discrimination, nous proposons une approche hierarchique et modulaire dans laquelle la combinaison intervient a un niveau intermediaire.

  • Titre traduit

    Statistical classifier combination, application to protein secondary structure prediction


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 169 P.
  • Annexes : 220 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université Pierre et Marie Curie. Bibliothèque Universitaire Pierre et Marie Curie . Section Mathématiques-Informatique Recherche.
  • Disponible pour le PEB
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : PMC RT P6 1997
  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : GUERMEUR c
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.