Choix d'unités appropriées et introduction de connaissances dans des modèles probabilistes pour la reconnaissance automatique de la parole

par Marc El-Bèze

Thèse de doctorat en Sciences appliquées

Sous la direction de Dominique Perrin.

Soutenue en 1990

à Paris 7 .


  • Résumé

    Dans le premier chapitre, sont exposés les différents critères servant à différencier la dictée automatique de la commande vocale ou de la compréhension de la parole. L'état de l'art est dressé, un grand nombre de systèmes évoqués. Dans le chapitre 2, sont données les raisons de la complexité du traitement automatique de la parole quelle que soit la langue, avant de recenser les difficultés additionnelles lorsque la dictée se fait en français. Le chapitre 3 regroupe des généralités sur la formulation du problème issue de la théorie de l'information, des rappels sur les processus markoviens, une description des systèmes de dictée PARSYFAL et TANGORA développés par IBM. Au chapitre 4, est argumenté l'intérêt de choisir la syllabe comme unité acoustique de base lors de la reconnaissance. Les syllabes phonétiques sont définies structurellement ainsi que par un algorithme de syllabification. Une statistique sur les syllabes du français est établie. Le chapitre 5 explique comment substituer à la modélisation phonétique des syllabes une modélisation par formes fénoniques (chaînes markoviennes dérivées de l'observation). Un algorithme original d'obtention de ces formes est proposé avant de rapporter des expériences de décodage comparant et combinant les deux modélisations. Le chapitre 6 décrit deux approches permettant de réduire au préalable la liste des syllabes candidates. Le chapitre 7 examine quelques points ouvrant la voie au traitement de la parole continue. Le chapitre 8 consacré aux modèles de langage montre comment améliorer la prédiction de chaque mot en enrichissant l'historique d'une dimension morphologique

  • Titre traduit

    Choice of adequate units and adding knowledge in probabilistic models for automatic speech recognition


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Annexes : 117 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Est Marne-la-Vallée. Bibliothèque.
  • Consultable sur place dans l'établissement demandeur
  • Cote : 1990 ELB
  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • Accessible pour le PEB
  • Cote : TS1990
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.