Contribution à l'identification automatique du locuteur sur des critères acoustiques et phonétiques

par Odile Mella

Thèse de doctorat en Informatique

Sous la direction de Marie-Christine Haton.

Soutenue en 1993

à Nancy 1 , en partenariat avec Université Henri Poincaré Nancy 1. Faculté des sciences et techniques (autre partenaire) .


  • Résumé

    Les recherches en reconnaissance automatique du locuteur peuvent être reparties en deux grandes classes, d'une part les recherches qui sont fondées sur les techniques de reconnaissance de formes issues de la reconnaissance automatique de la parole, et d'autre part, celles qui ont pour objectif d'exploiter explicitement la variabilité interlocuteur et la variabilité intralocuteur de la parole. Notre étude se situe dans cette seconde classe. Dans un premier temps, nous présentons les connaissances des domaines de la production de la parole et de la variabilité de la parole qui sont nécessaires à la compréhension de la problématique de la caractérisation du locuteur. Puis, nous plaçons notre travail dans le cadre plus général de la reconnaissance automatique du locuteur en présentant une synthèse des travaux les plus récents dans les deux classes de recherches définies au début de ce résumé. Enfin, nous développons les différentes étapes de notre étude. Apres une présentation des paramètres acoustiques et phonétiques sélectionnés comme susceptibles de caractériser au mieux le locuteur, nous décrivons les phases d'élaboration et d'étiquetage manuel de notre corpus. Puis, nous détaillons l'étude de la pertinence des trois premiers formants de sept voyelles orales dans un contexte /p-voyelle-r/. Pour cela, nous exposons une méthodologie de détermination automatique de valeurs robustes des trois premiers formants des voyelles et nous commentons les résultats obtenus. Ensuite, nous présentons, pour chacun des triplets sélectionnés, l'analyse de la pertinence des combinaisons de formants et des écarts entre les formants pour l'identification du locuteur. Cette analyse est fondée sur l'établissement de trois indicateurs issus d'expériences d'identification d'un locuteur parmi dix. Nous terminons par une interprétation de ces résultats.

  • Titre traduit

    Contribution to automatic speaker identification with acoustic and phonetic parameters


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (336 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 201 ref.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation - BU Sciences et Techniques.
  • Accessible pour le PEB
  • Bibliothèque :
  • PEB soumis à condition
  • Cote : MELLA c

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université Grenoble Alpes (Saint-Martin d'Hères, Isère). Bibliothèque et Appui à la Science Ouverte. Bibliothèque universitaire Joseph-Fourier.
  • Non disponible pour le PEB
  • Cote : MF-1993-MEL
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.