Détection de thème et adaptation des modèles de langage pour la reconnaissance automatique de la parole

par Armelle Brun

Thèse de doctorat en Informatique

Sous la direction de Jean-Paul Haton.

Soutenue en 2003

à Nancy 1 , en partenariat avec Université Henri Poincaré Nancy 1. Faculté des sciences et techniques (autre partenaire) .


  • Résumé

    Une des façons de procéder pour l'amélioration de la qualité des systèmes de Reconnaissance Automatique de la Parole (RAP) consiste à adapter le modèle de langage utilisé au thème du texte en cours de traitement. Nous proposons dans cette thèse une nouvelle approche de la sélection devocabulaire pour la détection de thème, qui permet d'améliorer légèrement les performances. Nous proposons également une méthode originale de détection de thème qui atteint des performances comparables à celles de l'état de l'art en exploitant un vocabulaire réduit. Nous avons également étudié la combinaison des méthodes de détection de thème. Celle-ci nous permet d'améliorer les performances de 10%, atteignant ainsi plus de 93\% de détection de thème correcte. Dans le cadre de l'intégration dans un système de RAP, nous avons montré amélioration conséquente de la perplexité.


  • Résumé

    One way to improve performance of Automatic Speech Recognition (ASR) systems, consists in adapting language models to the topic treated in data. In this thesis, we propose a new vocabulary selection principle, resulting in a slight improvement of the performance. We also present anew topic identification method, WSIM, based on the similarity between words and topics, reaching performance similar to state of the art one. We have studied the evolution of the performance when methods are combined, reaching more than 93% correct topic identification. In the framework of ASR, adapting language model to the topic results in a large improvement of the perplexity.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol.(142 p.)
  • Notes : Publication autorisée par le jury

Où se trouve cette thèse ?

  • Bibliothèque :
  • Disponible pour le PEB
  • Cote : SC N2003 3
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.