Thèse soutenue

Analyse acoustique de la voix pour la détection des émotions du locuteur
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Leila Kerkeni
Direction : Kosai RaoofMohamed Ali MahjoubYoussef SerrestouCatherine Cléder
Type : Thèse de doctorat
Discipline(s) : Acoustique
Date : Soutenance le 20/01/2020
Etablissement(s) : Le Mans en cotutelle avec Université de Sousse (Tunisie)
Ecole(s) doctorale(s) : Sciences de l'ingénierie et des systèmes (Centrale Nantes)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'acoustique de l'Université du Mans - Laboratoire d'Acoustique de l'Université du Mans / LAUM

Résumé

FR  |  
EN

L'objectif de cette thèse est de proposer un système de reconnaissance automatique des émotions (RAE) par analyse de la voix pour une application dans un contexte pédagogique d'orchestration de classe. Ce système s'appuie sur l'extraction de nouvelles caractéristiques, par démodulation en amplitude et en fréquence, de la voix ; considérée comme un signal multi-composantes modulé en amplitude et en fréquence (AM-FM), non-stationnaire et issue d'un système non-linéaire. Cette démodulation est basée sur l’utilisation conjointe de la décomposition en modes empiriques (EMD) et de l’opérateur d’énergie de Teager-Kaiser (TKEO).Dans ce système, le modèle discret (ou catégoriel) a été retenu pour représenter les six émotions de base (la tristesse, la colère, la joie, le dégoût, la peur et la surprise) et l'émotion dite neutre. La reconnaissance automatique a été optimisée par la recherche de la meilleure combinaison de caractéristiques, la sélection des plus pertinentes et par comparaison de différentes approches de classification. Deux bases de données émotionnelles de référence, en allemand et en espagnol, ont servi à entrainer et évaluer ce système. Une nouvelle base de données en Français, plus appropriée pour le contexte pédagogique a été construite, testée et validée.