Traitement de la prosodie en reconnaissance automatique de la parole

par Philippe Langlais

Thèse de doctorat en Informatique

Sous la direction de Henri Méloni.

Soutenue en 1995

à Avignon .


  • Résumé

    Les travaux presentes concernent le traitement de la prosodie dans les systemes de reconnaissance de la parole. Les principales etapes d'une approche prosodique classique (mesure des parametres, corrections microprosodiques et perceptives, application de regles suprasegmentales) font l'objet de discussions qui introduisent les choix faits pour chacune d'elles. Dans la premiere partie de ce memoire, sont abordees en detail les variations segmentales des parametres prosodiques. Un inventaire des principaux phenomenes abondamment etudies par le passe est tout d'abord propose. Chacun d'eux est alors etudie sur des corpus de mots prononces isolement afin de determiner d'une part, si l'emploi de techniques d'extraction automatique des parametres autorise l'usage de ces variations en tant qu'indice pertinent lors d'une phase de decodage acoustico-phonetique, et d'autre part, de verifier la robustesse d'un processus de correction des parametres prosodiques a l'aide de coefficients microprosodiques, dans le cadre d'un traitement automatique. La seconde partie de ce memoire presente les difficultes majeures liees a l'analyse prosodique suprasegmentale par un expert et tente d'expliquer le recours de plus en plus frequent a l'outil statistique pour y parvenir. Un systeme d'etude correlative automatique a ete developpe qui revendique d'une part l'assistance a l'analyse prosodique par un expert, et d'autre part, une fonction predictive de la structure linguistique d'un message a decoder. Deux applications de ce systeme sont alors proposees, l'une de reconnaissance de nombres decimaux (notre systeme s'est montre apte a localiser le mot virgule dans une chaine inconnue a partir des seules informations prosodiques), l'autre de reconnaissance de phrases de type lues avec des resultats qui valident pleinement notre approche globale de resolution

  • Titre traduit

    Treatment of prosody in automatic speech recognition


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (233 f.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. 194-206

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Avignon Université. Bibliothèque universitaire.
  • Disponible pour le PEB
  • Cote : T AVI 95-76
  • Bibliothèque : Université d'Avignon et des Pays de Vaucluse. Bibliothèque Agroparc.
  • Non disponible pour le PEB
  • Cote : T AVI 95-1

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Avignon Université. Bibliothèque universitaire.
  • Non disponible pour le PEB
  • Cote : T MF 19
  • Bibliothèque : Université Grenoble Alpes (Saint-Martin d'Hères, Isère). Bibliothèque et Appui à la Science Ouverte. Bibliothèque universitaire Joseph-Fourier.
  • Accessible pour le PEB
  • Cote : MF-1995-LAN
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.