Détection de mots clés dans un flux de parole

par Yassine Ben Ayed

Thèse de doctorat en Signal et images

Sous la direction de Gérard Chollet.

Soutenue en 2003

à Paris, ENST .


  • Résumé

    La reconnaissance automatique de la parole suscite actuellement un grand intérêt. En particulier, la détection de mots clés qui constitue une branche importante de l'interaction homme-machine vu le besoin de communiquer avec nos machines d'une façon naturelle et directe en utilisant la parole spontanée. Cette technique consiste à détecter dans une phrase prononcée, les mots clés caractérisant l'application et de rejeter les mots hors-vocabulaire ainsi que les hésitations, les faux départs etc. Le travail que nous présentons dans ce manuscrit s'inscrit dans le cadre de la détection de mots clés dans un flux de parole. Tout d'abord, nous proposons de nouveaux modèles "poubelles'' fondés sur la modélisation des mots hors-vocabulaire. Puis nous introduisons la reconnaissance à base de boucle de phonèmes, dans laquelle nous appliquons différentes fonctions de récompense favorisant la reconnaissance des mots clés. Ensuite nous proposons l'utilisation des mesures de confiance afin de pouvoir prendre la décision de rejeter ou d'accepter un mot clé hypothèse. Les différentes mesures de confiance proposées sont basées sur la probabilité d'observation acoustique locale. En premier lieu, nous utilisons les moyennes arithmétique, géométrique et harmonique comme mesures de confiance pour chaque mot clé. En second lieu, nous proposons de calculer la mesure de confiance en se basant sur la méthode à base de boucle de phonèmes. Enfin nous présentons le problème de détection comme un problème de classification où chaque mot clé peut appartenir à deux classes différentes, à savoir "correct'' et "incorrect''. Cette classification est réalisée en utilisant des Support Vector Machines

  • Titre traduit

    Keyword detection in a speech flow


  • Résumé

    The automatic speech recognition currently arouses a great interest. In particular, the keyword detection which constitutes a significant branch of the human-machine interaction and which can help us to communicate with our machines in a natural and direct way by using spontaneous speech. This technique consists in detecting in a pronounced sentence, the keywords characterizing the application and in rejecting out-of-vocabulary words as well as hesitations, false starts etc. The work presented in this thesis report deals with problem of keyword detection in a speech flow. First of all, we propose new garbage models founded on the modelling of the out-of-vocabulary words. Second, we introduce the recognition based on loop of phonemes, in which we apply various reward functions supporting keyword recognition. Then we propose to use confidence measures in order to make the decision of rejection or acceptance of a given keyword. The various confidence measures used are based on the probability of the local acoustic observation. First, we use these probabilities to calculate the arithmetic, geometric and harmonic means as confidence measures for each keyword. Second, we propose some others confidence measures based on the loop of phonemes recognition method. Finally we present the problem of detection as a classification problem where each keyword can belong to two different classes, namely ``correct'' and ``incorrect''. This classification is carried out by using Support Vector Machines (SVM) which constitute a new technique of statistical training. Each recognized keyword is represented by a characteristic vector which constitutes the entry of the SVM classifier.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (162 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. 152 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : BEN AYED d
  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.