Adaptation thématique non supervisée d'un système de reconnaissance automatique de la parole

par Gwénolé Lecorvé

Thèse de doctorat en Informatique

Sous la direction de Pascale Sébillot.

Soutenue en 2010

à Rennes, INSA .


  • Résumé

    Dans cette thèse, nous proposons un processus d'adaptation thématique non supervisée qui vise à spécialiser le modèle de langue (ML) et le vocabulaire d'un système de reconnaissance de la parole (RAP) en fonction du thème de chaque document à transcrire. Ce processus a comme singularité de ne nécessiter aucune connaissance a priori sur les éventuels thèmes rencontrés et d'intégrer des techniques de traitement automatique des langues. Il consiste à caractériser le thème d'un document audio par des mots-clés extraits automatiquement et à construire un corpus de pages Web du même thème. Nous ré-estimons alors le ML en fonction d'une terminologie issue de ce corpus, puis intégrons au système de nouveaux mots propres au thème en assimilant ceux-ci à d'autres avec lesquels il partagent des relations paradigmatiques. Nos expériences sur le corpus ESTER montrent que l'utilisation des ML et vocabulaire ainsi adaptés produit des améliorations du taux de reconnaissance d'un système de RAP.

  • Titre traduit

    Unsupervised topic-specific adaptation of an automatic speech recognition system


  • Résumé

    In this work, we propose a new unsupervised process to adapt the language model (LM) and the vocabulary of an automatic speech recognition system to the topic of each spoken document to be transcribed. This process is particularly original since it firstly avoids the use of any a priori knowledge about potentially encountered topics and secondly integrates natural language processing techniques. In order to achieve these goals, we characterize the topic of a spoken document by automatically extracting keywords from a first-pass automatic transcription before building a topic-specific corpus of Web pages. Then, the LM is re-estimated thanks to a terminology acquired from this corpus, and new topic-specific words are added to the vocabulary and integrated to the LM by relying on paradigmatic relations with in-vocabulary words. Experiments done on French-speaking broadcast news show that using these topic-adapted vocabulary and LM lead to recognition accuracy improvements.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (160 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr.p.155-158 (199 réf.). Index

Où se trouve cette thèse ?

  • Bibliothèque : Institut National des Sciences Appliquées. Bibliothèque.
  • Disponible pour le PEB
  • Cote : THE LEC
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.