Authentification vocale par telephone en mode dependant du texte

par Delphine Charlet

Thèse de doctorat en Sciences et techniques

Sous la direction de Jean-Pierre Tubach.

Soutenue en 1997

à l'ENST .

    mots clés mots clés


  • Résumé

    Dans cette these, on etudie comment la connaissance du texte prononce par le locuteur peut etre exploitee en authentification vocale. Les systemes de verification proposes ne sont fondamentalement que des systemes de reconnaissance de parole monolocuteur (hmm ou dtw), dans lesquels on modifie l'etage de decision en considerant en plus du score du modele monolocuteur un score rendant compte de la qualite intrinseque de la parole prononcee. Plusieurs facons d'estimer et d'integrer dans la decision un score autre que celui du locuteur pretendu sont etudiees et un modele de normalisation qui permet au locuteur de choisir librement son mot de passe avec des performances acceptables est propose. La connaissance du texte prononce par le locuteur est egalement utilisee dans le calcul de la mesure de similarite entre le test et la reference. On propose d'interpreter les systemes de verification hmm ou dtw comme des classificateurs en deux etapes distinctes, la premiere etant l'alignement qui doit assurer la mise en correspondance d'evenements acoustiques de test et de reference selon un critere de reconnaissance de parole, la deuxieme etape etant le calcul du score de verification, qui doit mesurer ce qui, pour un evenement acoustique donne, fait la specificite du locuteur. Un formalisme pour l'optimisation du calcul du score de verification est propose. Il concerne l'espace acoustique utilise pour representer le locuteur : on recherche parmi un ensemble de parametres acoustiques potentiels le jeu optimal selon un critere de minimisation du taux d'erreur. Ce formalisme est applique a l'etude d'espaces acoustiques parmi les plus frequemment utilises et permet d'identifier des jeux de taille restreinte et beaucoup plus robustes a peu de donnees d'apprentissage que les jeux de parametres classiquement utilises pour representer le locuteur. Enfin, des experiences sur une base de donnees publique valident les approches proposees et concluent ce travail.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 247 p.
  • Annexes : 94 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.