Analyse automatique de signaux d'auscultation cervicale à haute résolution : Détection et caractérisation des déglutitions
| Auteur / Autrice : | Lila Gravellier | 
| Direction : | Julien Pinquier, Jérome Farinas, Maxime Le Coz | 
| Type : | Thèse de doctorat | 
| Discipline(s) : | Informatique et Télécommunications | 
| Date : | Soutenance le 04/10/2024 | 
| Etablissement(s) : | Université de Toulouse (2023-....) | 
| Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) | 
| Partenaire(s) de recherche : | Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....) | 
| Etablissement de délivrance conjointe : Université Toulouse 3 Paul Sabatier (1969-2024) | |
| Jury : | Président / Présidente : Corinne Fredouille | 
| Rapporteurs / Rapporteuses : Thomas Hueber, Sylvain Morinière | 
Mots clés
Résumé
Les troubles de la déglutition (ou dysphagie) affectent 8% de la population mondiale, représentant un défi majeur pour la santé publique. Non diagnostiqués et non traités, ils peuvent entraîner des infections pulmonaires, une malnutrition, voire être fatals. Les examens cliniques de référence d'évaluation de la déglutition, tels que la vidéofluoroscopie (rayons X) et la nasofibroscopie (endoscope nasal), sont limités par leur caractère invasif, leur coût, leur accessibilité restreinte, et les risques liés à l'irradiation. De plus, le cadre très contrôlé nécessaire pour ces examens peut mener à des comportements non représentatifs de l'état réel du patient, nuisant à l'efficacité du diagnostic et du traitement. La recherche sur la dysphagie vise à développer des méthodes alternatives non-invasives et accessibles pour évaluer la déglutition. L'auscultation cervicale à haute résolution (ACHR), utilisant des capteurs externes tels que des microphones et des accéléromètres et une analyse des signaux résultants, émerge comme une solution prometteuse. Ces signaux ont démontré leur potentiel à travers différentes études: ils permettent ainsi de distinguer sujets sains et sujets dysphagiques, d'évaluer le degré de sévérité de la dysphagie, et de suivre les mécanismes physiologiques. Ces analyses nécessitent l'identification préalable des déglutitions, souvent par leur identification sur des images obtenues simultanément avec un examen de référence. Cette étape d'annotation manuelle s'avère très coûteuse en temps, ce qui la rend difficilement réalisable en contexte clinique. Comment détecter et localiser automatiquement les déglutitions et autres événements pertinents dans les signaux pour faciliter leur utilisation ? Différentes études se sont intéressées à la détection automatique de la déglutition, mais généralement dans des conditions expérimentales très contrôlées. De plus, les métriques utilisées ou le manque de précision dans la description des protocoles ne permettent pas toujours d'interpréter le cas d'utilisation réel de ces algorithmes. Cette thèse CIFRE, conduite en partenariat entre le laboratoire d'informatique de Toulouse et l'entreprise Swallis Medical, qui a développé un dispositif d'ACHR, s'inscrit dans une démarche innovante visant à faciliter le diagnostic de la dysphagie. Nous proposons, d'une part, une méthodologie pour l'enregistrement de signaux ACHR et leur annotation reproductible, soutenue par la création d'un corpus initial de 20 heures d'enregistrements réalisés sur 60 sujets sains. D'autre part, grâce à ces données, nous avons pu mettre en œuvre des techniques d'apprentissage profond pour détecter et localiser automatiquement les événements d'intérêt au sein des signaux, d'abord dans un environnement contrôlé avant de progresser vers des conditions plus naturelles. L'analyse des erreurs, de la variabilité des signaux et de l'apport des deux capteurs (microphone et accéléromètre), nous a guidés vers le développement d'un modèle robuste, composé d'un détecteur d'activité, suivi de l'analyse de spectrogrammes par un réseau CNN+LSTM. Cette méthode nous permet de très bien détecter les déglutitions, les mécanismes de défense des voies aériennes et les phonations, aussi bien en conditions contrôlées qu'en conditions écologiques (F-score supérieur à 85 %). Ce modèle permet également une structuration efficace des données ACHR, simplifiant leur interprétation par les professionnels de santé et pavant la voie à l'élaboration de nouveaux algorithmes diagnostiques. Ainsi, cette thèse constitue une première étape pour mieux comprendre les signaux d'ACHR et pour extraire les événements d'intérêt des signaux, lesquels peuvent servir au calcul d'indicateurs pertinents ou au suivi en temps réel des enregistrements en contexte clinique. Elle ouvre également la voie à de futures recherches sur leur utilisation dans le diagnostic de la dysphagie.