Auteur / Autrice : | Leila Kerkeni |
Direction : | Kosai Raoof, Mohamed Ali Mahjoub, Youssef Serrestou, Catherine Cléder |
Type : | Thèse de doctorat |
Discipline(s) : | Acoustique |
Date : | Soutenance le 20/01/2020 |
Etablissement(s) : | Le Mans en cotutelle avec Université de Sousse (Tunisie) |
Ecole(s) doctorale(s) : | Sciences de l'ingénierie et des systèmes (Centrale Nantes) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'acoustique de l'Université du Mans - Laboratoire d'Acoustique de l'Université du Mans / LAUM |
Mots clés
Résumé
L'objectif de cette thèse est de proposer un système de reconnaissance automatique des émotions (RAE) par analyse de la voix pour une application dans un contexte pédagogique d'orchestration de classe. Ce système s'appuie sur l'extraction de nouvelles caractéristiques, par démodulation en amplitude et en fréquence, de la voix ; considérée comme un signal multi-composantes modulé en amplitude et en fréquence (AM-FM), non-stationnaire et issue d'un système non-linéaire. Cette démodulation est basée sur l’utilisation conjointe de la décomposition en modes empiriques (EMD) et de l’opérateur d’énergie de Teager-Kaiser (TKEO).Dans ce système, le modèle discret (ou catégoriel) a été retenu pour représenter les six émotions de base (la tristesse, la colère, la joie, le dégoût, la peur et la surprise) et l'émotion dite neutre. La reconnaissance automatique a été optimisée par la recherche de la meilleure combinaison de caractéristiques, la sélection des plus pertinentes et par comparaison de différentes approches de classification. Deux bases de données émotionnelles de référence, en allemand et en espagnol, ont servi à entrainer et évaluer ce système. Une nouvelle base de données en Français, plus appropriée pour le contexte pédagogique a été construite, testée et validée.