Extraction robuste de parametres prosodiques pour la reconnaissance de la parole

par EDOUARD GEOFFROIS

Thèse de doctorat en Sciences appliquées

Sous la direction de J. MARIANI.

Soutenue en 1995

à Paris 11 .

    mots clés mots clés


  • Résumé

    L'information prosodique, et particulierement la frequence fondamentale et la duree des sons, est importante pour developper des systemes de reconnaissance de la parole generaux et performants, mais est sous-utilisee a l'heure actuelle. Une raison a cela est le manque de robustesse des representations classiques de l'information prosodique. Nous proposons de nouveaux parametres prosodiques qui, tout en representant le meme type d'informations que les parametres classiques, sont calcules sans prise de decision intermediaire, ce qui les rend plus robustes face a la variabilite du signal de parole. De plus, ces parametres, ne dependant pas d'une segmentation a priori, peuvent etre integres directement dans le vecteur de parametres d'entree d'un systeme de reconnaissance. Ceci permet un traitement homogene et simultane des informations prosodiques et segmentales, et notamment d'appliquer des algorithmes statistiques de reconnaissance de la parole sans modification. Ces parametres ont ete developpes conjointement a un systeme complet d'etiquetage prosodique. Pour entrainer et tester le systeme, nous avons etiquete prosodiquement un corpus de parole spontanee comportant 1115 requetes, prononcees par 20 locuteurs. Le jeu de marqueurs est derive d'un systeme de description phonologique de l'intonation du francais. Les modeles appris sur ce corpus sont egalement evalues sur un autre corpus pour une tache de levee d'ambiguite. Ces nouvelles representations de l'information prosodique etendent la gamme de situations correctement traitees, permettent une meilleure integration de l'information prosodique en reconnaissance de la parole, et constituent des outils au service des recherches en phonetique et en linguistique


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 208 P.
  • Annexes : 202 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Accessible pour le PEB
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : TH2014-012586
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.