Thèse soutenue

Capteur polyvalent acoustique pour l'habitat intelligent

FR  |  
EN
Auteur / Autrice : Ammar Ahmed
Direction : Kosai RaoofJean-François DiourisYoussef Serrestou
Type : Thèse de doctorat
Discipline(s) : Acoustique
Date : Soutenance le 04/05/2023
Etablissement(s) : Le Mans
Ecole(s) doctorale(s) : Sciences de l'ingénierie et des systèmes (Centrale Nantes)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'acoustique de l'Université du Mans - Laboratoire d'Acoustique de l'Université du Mans / LAUM
Jury : Examinateurs / Examinatrices : Marion Berbineau
Rapporteurs / Rapporteuses : Emil Novakov, Mounir Sayadi

Résumé

FR  |  
EN

Les sons environnementaux proviennent généralement de sources diverses et variées, telles que l’activité humaine, les objets et la nature. La classification automatique de ces sons suscite récemment un grand intérêt grâce à son grand potentiel d’application dans divers domaines, comme l’interaction home-machine, l’habitat intelligent, l’audition robotique, la reconnaissance automatique d’activités, les systèmes de surveillance automatique, etc. Dans le cas d’un habitat intelligent, L’hétérogénéité des événements à surveiller conduit à l’usage d’un grand nombre de capteurs, de différentes natures, ce qui impacte le coût, la consommation énergétique, la complexité d’installation et de gestion ainsi que l’encombrement et le volume de données à traiter. L’objectif de cette thèse est de démontrer que l’utilisation de la classification automatique des sons environnementaux (ECS pour Environmental Sound Classification en anglais), apporte une solution à cette problématique de réduction du nombre et de la diversité des capteurs en remplaçant tout ou une partie de ces capteurs par des capteurs acoustiques. La faisabilité de cette solution a été validée par le développement d’un système, implémenté sur une carte composée d’un microcontrôleur (Cortex M4) à faible empreinte mémoire et à basse consommation et d’un microphone, pour la reconnaissance automatique en temps réel de quatre sons environnementaux (pluie, vent, pas humain et passage de voiture). Pour une meilleure adéquation algorithme-architecture, différentes méthodes d'extraction et de sélection de caractéristiques et différents modèles d'apprentissage automatique ont été étudiés et comparés. Une nouvelle approche d’extraction de caractéristiques à partir du spectrogramme d’amplitude et de fréquence instantanées (SAFI), a été proposée et comparée à l’approche traditionnelle utilisant le spectrogramme de Mel. Pour s’affranchir des limitations de l’approche traditionnelle, liées au fait que les sons environnementaux sont des signaux multi-composantes, non-stationnaire et issus de systèmes non-linéaires, la construction du spectrogramme d’amplitude et de fréquence instantanées est effectuée par décomposition en modes empiriques (EMD) couplée à l’opérateur d’énergie de Teager-Kaiser (TKEO). Pour générer le modèle d’apprentissage, une base de données de sons environnementaux choisis a été construite. Les modèles d’apprentissage retenus sont les réseaux de neurones convolutifs (CNN) et convolutifs profonds (DSCNN), optimisés en termes du nombre de paramètres et de caractéristiques. Cette optimisation est effectuée grâce à une méthode de sélection de caractéristiques par réseau de neurones récurrent (RNN). Ce système de reconnaissance automatique développé a été évalué avec de nouveaux signaux pour une classification en temps réel.