Achile : un dispositif de decodage acoustico-phonetique et d'identification lexicale independant du locuteur a partir de modules mixtes

par ALAIN GHIO

Thèse de doctorat en Sciences appliquées

Sous la direction de Mario Rossi.

Soutenue en 1997

à Aix Marseille 3 .


  • Résumé

    La reconnaissance de la parole est une activite dont le but est de faire identifier, par des machines, ce qui est dit par une personne. Le processus peut consister a reconnaitre des sons (decodage acoustico-phonetique), des mots (identification lexicale) ou des phrases. Un tel systeme est soit concu pour un seul utilisateur, soit pour differents locuteurs. Achile est un dispositif de decodage acoustico-phonetique et d'identification lexicle. Il permet la reconnaissance de mots isoles independamment du locuteur sans phase d'apprentissage, ni d'adaptation. Notre objectif est d'examiner jusqu'a quel point un modele a base de connaissances phonetiques est capable de decoder de facon automatique la structure phonique de la parole sans recourir aux methodes stochastiques. Le dispositif s'inspire, d'un point de vue fonctionnel, du traitement cognitif humain. La tache de reconnaissance est effectuee par repartition du travail et interaction d'une societe d'experts. Le signal de parole alimente tout d'abord les analyseurs de bas niveau. Pour cela, est utilisee, entre autre, une analyse spectrale fondee sur modele auditif qui tient compte de la notion de ponderation sonique et de bandes critiques. Les processus de bas-niveau transmettent leurs donnees a plusieurs modules de decodage fonctionnant en parallele (segmentation, reconnaissance globale et analytique). Les resultats sont ensuite transmis aux modules de haut-niveau qui agissent en utilisant des connaissances symboliques (representations phonologiques, acces lexical). Un moteur d'inferences se charge de prendre une decision finale en comparant les donnees d'un dictionnaire aux donnees decodees. L'evaluation du dispositif sur un lexique de 500 mots nous permet de quantifier la pertinence des connaissances, des analyses et des algorithmes employes. C'est aussi le moyen de pouvoir faire evoluer le dispositif en apportant des modifications.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : (231 p.)
  • Annexes : Notes bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Aix-Marseille (Marseille. Saint-Jérôme). Service commun de la documentation. Bibliothèque de sciences.
  • Disponible pour le PEB
  • Bibliothèque : Université d'Aix-Marseille (Marseille. Saint-Jérôme). Service commun de la documentation. Bibliothèque de sciences.
  • Disponible pour le PEB
  • Cote : T 2588/A-B
  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : GHIO a
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.