Méthodes statistiques pour la compréhension automatique de la parole

par Selma Jamoussi

Thèse de doctorat en Informatique

Sous la direction de Kamel Smaïli et de Jean-Paul Haton.


  • Résumé

    Le travail présenté dans ce manuscrit vise à réaliser un système de compréhension de la parole spontanée spécifique à un domaine. Nous nous intéressons plus particulièrement à l'interrogation orale de bases de données. Dans notre travail, nous nous sommes basés sur une approche statistique qui considère que la compréhension est un processus de traduction de la parole en des concepts sémantiques. L'idée que nous défendons est qu'il est possible d'obtenir des concepts sémantiques significatifs par des méthodes de classification automatique. Pour ce faire, nous commençons par proposer des mesures permettant de quantifier les relations sémantiques entre mots. Ensuite, nous testons quelques méthodes de partionnement : l'algorithme des K-means et les cartes de Kohonen. Nous proposons également l'utilisation des réseaux neuronaux de Oja et Sanger. Enfin, nous utilisons le réseau bayésien AutoClass conçu pour la classification non supervisée et qui nous a fourni des concepts significatifs.


  • Résumé

    The work presented in this manuscript aims to carry out an understanding system for the spontaneous speech. We are interested in specific domain systems that concern the oral interrogation of data bases. Our work is based on statistical approach which considers the understanding problem as a translation process between words and semantic concepts. The idea we defend in this thesis is the possibility to obtain significant semantic concepts using clustering methods. We start by defining some semantic measures to quantify the semantic relations between words. Then, we use triggers to build up concepts in an automatic way. In order to improve we test two well known methods : the K-means algorithm and the Kohonen maps. We also propose the use of the Oja and Sanger neural networks. The latter proved to be ineffective in our case. Lastly, we use a Bayesian network conceived for clustering and called AutoClass. AutoClass provides clear and significant concepts.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : XX-220 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 173-182

Où se trouve cette thèse ?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation et de l'Edition - BU Sciences et Techniques.
  • Disponible pour le PEB
  • Cote : SC n2004 170
  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : Jamoussi m
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.