Fusion d'informations en identification automatique des langues

par Jorge Arturo Gutiérrez Celaya

Thèse de doctorat en Informatique

Sous la direction de Régine André-Obrecht.

Soutenue en 2005

à Toulouse 3 .


  • Résumé

    En identification automatique des langues nous nous intéressons au problème de fusion des informations de décision issues de différents experts. Pour explorer et comparer des stratégies de fusion, nous les modélisons au moyen de méthodes formelles de classification provenant soit de la théorie statistique, comme les mélanges de lois gaussiennes, les réseaux de neurones et le classificateur discriminant, soit des travaux de recherche récents pour les théories des possibilités et des fonctions de croyance. Nous proposons une méthodologie formelle de fusion dans le paradigme bayésien : l'évaluation de la performance des experts par l'analyse factorielle discriminante fournit des indices de confiance, l'agrégation des décisions privilégie les méthodes donnant, directement ou par transformation, des valeurs de probabilité ou de vraisemblance pour les langues et la pondération de nouvelles fonctions de coût avec les indices de confiance conduit à la prise de décision par minimum de risque.

  • Titre traduit

    Information fusion in automatic language identification


  • Résumé

    Fusing decision information coming out of different experts is an important issue in Automatic Language Identification. In order to explore and compare different fusion strategies, the information behaviour is modelled by means of formal classification methods provided either by the Statistics Theory, such as the Gaussian Mixture Model, the Neural Networks and the Discriminant Classifier, or by recent research advances in Possibility and Evidential Theories. As an alternative to empirical procedures, a formal fusion methodology within the Bayesian paradigm is proposed: evaluating expert performance by means of the Discriminant Factor Analysis provides us with confidence indices, aggregating expert decisions takes us to choose those fusion methods that provide us directly, or after transformation, with probability or likelihood values of languages, and building and weighting new loss functions with confidence indices lead us to make unique decisions by minimum risk.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ( 213 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 203-213

Où se trouve cette thèse ?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 2005TOU30098
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.