Techniques d'analyse et de synthèse de la parole appliquées à l'apprentissage des langues

par Vincent Colotte

Thèse de doctorat en Informatique

Sous la direction de Yves Laprie.

Soutenue en 2002

à Nancy 1 , en partenariat avec Université Henri Poincaré Nancy 1. Faculté des sciences et techniques (autre partenaire) .


  • Résumé

    À l'heure où les échanges entre les individus ne cessent de s'internationaliser, la maîtrise d'une langue étrangère devient peu à peu indispensable. L'apprentissage d'une langue assisté par ordinateur apparaît comme un nouvel enjeu. En particulier, l'amélioration de compréhension orale constitue l'une des clés de la maîtrise d'une langue. Pour améliorer l'intelligibilité, j'ai élaboré une première stratégie basée sur le ralentissement sélectif du signal de parole. Les parties transitoires, de forte concentration d'indices acoustiques, se révèlent être des candidats privilégiés pour le ralentissement. La détection de ces régions est basée sur le calcul d'un coefficient reflétant le taux de variation du spectre. J'ai élaboré une seconde stratégie consistant à renforcer les évènements pertinents de la parole c'est-à-dire ceux dont l'amplification améliore l'intelligibilité. J'ai basé ma stratégie sur le principe de préservation des oppositions phonétiques, notamment entre les consonnes voisées et non-voisées. Ainsi, j'ai développé un algorithme de détection des bursts et des fricatives sourdes à partir de critères énergétiques. Des expériences de perception ont validé les stratégies d'amélioration de l'intelligibilité : une préliminaire avec des français sur des phrases américaines (TIMIT) et une seconde avec des étudiants étrangers (apprenant le français comme langue étrangère) sur des phrases françaises (BDSON). Enfin, pour réaliser ces modifications prosodiques (rythme, intensité, fréquence fondamentale), je me suis appuyé sur la méthode PSOLA. J'ai élaboré un algorithme de marquage de la période du fondamental et amélioré la précision de la méthode de synthèse. La mise en oeuvre de ces stratégies est totalement automatique et cette approche permet d'améliorer l'intelligibilité d'un signal de parole dans le cadre de l'apprentissage d'une langue.


  • Résumé

    Nowadays when exchanges between people are more and more international, foreign language grasp is becoming essential. The computer-assisted language learning seems to be a new stake. In particular, the improvement of oral comprehension constitutes one of keys to control a language. To improve intelligibility, I work out a first strategy based on selective slowing down of speech signal. The transitory parts - regions of high acoustic cue concentration - turns out to be privileged candidates to the slowing down. The detection of these regions is based on the computation of a coefficient which reflects spectrum variation rate. I work out a second strategy which enhances relevant events of speech, i. E. That its amplification improves intelligibility. This strategy is based on the preservation of phonetic contrasts, in particular between voiced and unvoiced consonants. Thus, I developed an algorithm of detection of unvoiced plosives and unvoiced fricatives from criteria on energy. Two experiments of perception have been carried out to validate these strategies of intelligibility improvement: the first, preliminary, with French listeners on American sentences and the second with foreign students (learning French as foreign language) on French sentences. At last, to modify the prosodic elements (rhythm, intensity, fundamental frequency), my work was based on PSOLA method (Pitch Synchronous OverLap and Add). I work out an algorithm of pitch marking and I improve the accuracy of synthesis method. These strategies are totally automatic and allow to improve intelligibility of speech signal in the framework of language learning.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol.(158 p.)
  • Notes : Publication autorisée par le jury

Où se trouve cette thèse ?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation et de l'Edition - BU Sciences et Techniques.
  • Disponible pour le PEB
  • Cote : SC N2002 222
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.