Authentification vocale par téléphone en mode dépendant du texte

par Delphine Charlet

Thèse de doctorat en Sciences et techniques

Sous la direction de Jean-Pierre Tubach.

Soutenue en 1997

à Paris, ENST .

    mots clés mots clés


  • Résumé

    Dans cette thèse, on étudie comment la connaissance du texte prononce par le locuteur peut être exploitée en authentification vocale. Les systèmes de vérification proposes ne sont fondamentalement que des systèmes de reconnaissance de parole mono locuteur (hmm ou dtw), dans lesquels on modifie l'étage de décision en considérant en plus du score du modèle monolocuteur un score rendant compte de la qualité intrinsèque de la parole prononcée. Plusieurs façons d'estimer et d'intégrer dans la décision un score autre que celui du locuteur prétendu sont étudiées et un modèle de normalisation qui permet au locuteur de choisir librement son mot de passe avec des performances acceptables est proposé. La connaissance du texte prononce par le locuteur est également utilisée dans le calcul de la mesure de similarité entre le test et la référence. On propose d'interpréter les systèmes de vérification hmm ou dtw comme des classificateurs en deux étapes distinctes, la première étant l'alignement qui doit assurer la mise en correspondance d'évènements acoustiques de test et de référence selon un critère de reconnaissance de parole, la deuxième étape étant le calcul du score de vérification, qui doit mesurer ce qui, pour un évènement acoustique donne, fait la spécificité du locuteur. Un formalisme pour l'optimisation du calcul du score de vérification est proposé. Il concerne l'espace acoustique utilise pour représenter le locuteur : on recherche parmi un ensemble de paramètres acoustiques potentiels le jeu optimal selon un critère de minimisation du taux d'erreur. Ce formalisme est applique à l'étude d'espaces acoustiques parmi les plus fréquemment utilises et permet d'identifier des jeux de taille restreinte et beaucoup plus robustes a peu de données d'apprentissage que les jeux de paramètres classiquement utilises pour représenter le locuteur. Enfin, des expériences sur une base de données publique valident les approches proposées et concluent ce travail.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (247 p.)
  • Annexes : 94 ref.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Télécom Paris. Centre de ressources documentaires numériques (CRDN).
  • Disponible pour le PEB

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 1997ENST0033
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.