Thèse soutenue

Decodage acoustico-phonetique multilingue : systeme a base de connaissances et etiquetage automatique de corpus de parole

FR  |  
EN
Auteur / Autrice : Harouna Kabre
Direction : Guy Pérennou
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1991
Etablissement(s) : Toulouse 3

Résumé

FR

La comprehension des mecanismes du langage oral et l'apprentissage des systemes de reconnaissance automatique de la parole necessitent la definition d'un lien entre le niveau acoustique et le niveau phonetique. Cela suppose que l'on sache faire une identification totale (cas de la reconnaissance) ou partielle (cas de l'etiquetage) de prototypes d'unites phonetiques dans le continuum sonore. Dans ce memoire nous presentons un ensemble d'outils methodologiques et informatiques pour l'etiquetage et la reconnaissance de la parole continue a savoir, une methode d'analyse acoustique temporelle du signal vocal et un generateur de systemes a base de connaissances pour la mise au point de modeles de decodage acoustico-phonetique. Ces outils nous ont permis de proposer un systeme d'etiquetage automatique multilingue et de mettre en uvre un ensemble de modules de decodage acoustico-phonetique en vue de la preselection de sous-vocabulaire. Les trois premiers chapitres mettent en evidence les difficultes de la reconnaissance de la parole continue et decrivent des outils que nous avons developpes dans le but de resoudre les problemes poses. Dans le premier chapitre, nous insistons plus particulierement sur les travaux qui ont ete faits par d'autres equipes autour des systemes analytiques. Dans le second chapitre, nous decrivons une methode d'analyse acoustique temporelle qui combine a la fois les transformations morphologiques et les techniques des moindres carres. Cette methode permet de deriver un ensemble restreint de parametres acoustiques, robustes pour l'etiquetage automatique. Dans le troisieme chapitre, nous presentons un generateur de systemes a base de connaissances (tex) particulierement adapte a l'experimentation d'algorithmes de decodage acoustico-phonetique. Ce generateur utilise une technique de representation des connaissances du type reseaux atn (augmented transition networks) et est construit autour de la notion d'operateur definie dans le meme chapitre. Les deux derniers chapitres correspondent a des applications effectives de ces outils pour l'etiquetage automatique et la reconnaissance phonetique. Nous presentons le systeme d'etiquetage en evenements que nous avons propose dans le cadre du projet sam (speech assessment methodology) et qui permet d'etiqueter de maniere independante des langues. La generation d'un treillis de phonemes par le systeme tex fait l'objet du dernier chapitre