Approches statistiques et filtrage vectoriel de trajectoires spectrales pour l'identification du locuteur independante du texte

par IVAN MAGRIN CHAGNOLLEAU

Thèse de doctorat en Sciences appliquées

Sous la direction de Frédéric Bimbot.

Soutenue en 1997

à l'ENST .

    mots clés mots clés


  • Résumé

    L'identification du locuteur consiste a attribuer une identite au locuteur d'un enonce. Cette identite sera celle du locuteur d'une base de reference qui est le plus proche de ce locuteur inconnu, au sens d'une mesure de similarite donnee. Le mode independant du texte signifie qu'il n'y a aucune contrainte sur le contenu des phrases prononcees. Au cours de cette these, nous developpons un ensemble de mesures de similarite reposant sur une modelisation statistique gaussienne de vecteurs de parametres obtenus a l'issue d'une analyse spectrale. Ces mesures reposent essentiellement sur les matrices de covariance de ces vecteurs de parametres. Une symetrisation de ces mesures est egalement proposee. Toutes ces mesures, sous leurs differentes formes, sont systematiquement testees sur les bases timit et ntimit. Une fois ces mesures de reference etablies, nous tentons de prendre en compte les aspects dynamiques des sequences de vecteurs de parametres. Ceci nous conduit a etudier les modeles auto-regressifs vectoriels dans le cadre de l'identification du locuteur. Nous testons systematiquement differentes facons de combiner les erreurs residuelles de prediction obtenues a l'aide de ces modeles, et comparons les resultats aux mesures de reference precedentes. Nous mettons en uvre egalement un protocole experimental qui permet de mesurer l'efficacite des modeles ar-vectoriels en identification du locuteur apres avoir detruit la structure temporelle des vecteurs de parametres. Nous etablissons alors un formalisme beaucoup plus general pour le filtrage des sequences de vecteurs de parametres, que nous appelons filtrage vectoriel de trajectoires spectrales. Ce formalisme englobe un grand nombre d'approches classiques en traitement de la parole, parmi lesquelles on trouve les modeles ar-vectoriels, l'analyse cepstrale, les parametres et , la parametrisation rasta, la transformee en cosinus de trajectoires spectrales, l'avantage de ce type de filtrage est qu'il opere simultanement dans les dimensions temporelle et frequentielle. Nous presentons finalement un autre filtrage particulier, qui entre dans le cadre du formalisme precedent. Ce filtrage repose sur une analyse en composantes principales temps-frequence de parole multi-locuteur. En conclusion, il apparait que le filtrage vectoriel de trajectoires spectrales est tres prometteur, puisqu'il permet de prendre en compte une evolution temporelle des vecteurs de parametres, tout en filtrant ces memes vecteurs dans la dimension frequentielle. Il permet aussi d'unifier de nombreuses approches differentes. En outre, ce travail suggere de nouvelles approches au niveau de la representation du signal de parole, et plus particulierement dans le cadre de la reconnaissance de la parole et du locuteur. Ce type de filtrage peut enfin s'appliquer a d'autres familles de signaux.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 254 P.
  • Annexes : 173 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : MAGRIN-CHAGNOLLEAU a
  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.