Thèse soutenue

Big Data et machine learning pour améliorer le suivi et la télésurveillance médicale

FR  |  
EN
Auteur / Autrice : Anna Karen Gárate Escamilla
Direction : Amir Hajjam El Hassani
Type : Thèse de doctorat
Discipline(s) : Sciences pour l'Ingénieur
Date : Soutenance le 26/05/2020
Etablissement(s) : Bourgogne Franche-Comté
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; 1991-....)
Partenaire(s) de recherche : Laboratoire : Nanomédecine, imagerie, thérapeutique (Besançon) - Nanomédecine- imagerie- thérapeutique - UFC / NIT / NANOMEDECINE
Etablissement de préparation : Université de technologie de Belfort-Montbéliard (1999-....)
Jury : Président / Présidente : Vincent Hilaire
Examinateurs / Examinatrices : Vincent Hilaire, Parisa Shariat Ghodous, Germain Forestier, Dan Mircea Istrate, Emmanuel Andrès
Rapporteurs / Rapporteuses : Parisa Shariat Ghodous, Germain Forestier

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

L'évolution de la quantité de données médicales collectée offre aux médecins une nouvelle opportunité d'améliorer le diagnostic des patients. Ces dernières années, les praticiens ont accru l'utilisation des technologies informatiques afin de fournir une meilleure aide à la décision. Une façon de relever ce défi est la construction des modèles avec des données empiriques issues d'expériences de santé à grande échelle, comme celles qui ont été établies au cours des dernières décennies pour certains systèmes de santé en ligne, pour des applications mobiles ou encore pour la télémédecine. L'apprentissage est un outil analytique qui permet d'identifier des modèles et des relations en tirant les leçons de l'expérience. Cette thèse a utilisé des mesures individuelles provenant de certaines ensembles de données, notamment un ensemble de données sur les maladies cardiaques, bases de données sur les femmes enceintes au premier trimestre souffrant d'hypothyroïdie et des données médicales synthétiques (avec plus de 5 000 patients et 1 000 000 de caractéristiques). Plus précisément, les objectifs de cette thèse sont : (i) optimiser le temps d'exécution et l'extensibilité des prévisions des bases de données sanitaires à grande échelle et déployer une configuration optimisée, (ii) prédire si un patient souffre d'une maladie cardiaque en utilisant des techniques de classification et décrire les caractéristiques les plus corrélées avec l'état cardiaque et (iii) utiliser des modèles d'apprentissage non supervisés pour enrichir les ontologies médicales et générer de nouvelles connaissances basées sur la recherche de caractéristiques et de symptômes similaires. Après avoir établi les connaissances nécessaires, j'ai réalisé différents modèles d'apprentissage qui mettaient en relation les caractéristiques (c'est-à-dire les maladies du cœur liées au cholestérol, au rythme cardiaque et aux douleurs thoraciques). Par ailleurs, j'ai créé les clusters pour les femmes enceintes au premier trimestre souffrant d'hypothyroïdie (c'est-à-dire le cluster utilisant la pathologie thyroïdienne, le risque, les facteurs anthropométriques, gynécologiques). Mes résultats ont révélé cela : (i) la régression logique présentait un temps d'exécution et une évolutivité optimaux sans être affectés par des opérations de calcul complexes, (ii) les méthodes de mise en cache et de persistance sont puissantes pour réduire le temps de consommation, (iii) l'ACP a donné de meilleurs résultats après utilisation du chi carré, sinon, lorsque l'ACP est utilisée directement à partir des données brutes, les performances sont médiocres, (iv) le cholestérol, la fréquence cardiaque maximale, les douleurs thoraciques et les vaisseaux cardiaques sont les caractéristiques anatomiques et physiologiques pertinentes des maladies cardiaques et (v) l'analyse par groupes s'est révélée être une approche pratique pour l'hétérogénéité des facteurs de risque d'hypothyroïdie chez les femmes au cours du premier trimestre de la grossesse dans les études cliniques. Pour ce dernier point, les trois groupes identifiés sont : les femmes de plus de 30 ans ne présentant pas de signes ni de symptômes d'hypofonctionnement de la thyroïde, les femmes de moins de 30 ans ne présentant pas de signes et symptômes d'hypofonctionnement de la thyroïde et les femmes de moins de 30 ans présentant certains facteurs de risque et des signes ou symptômes suggérant un hypofonctionnement de la thyroïde. Mes résultats soulignent que les techniques de réduction de la dimensionnalité et l'apprentissage ont amélioré la détection de situations anormales dans le cadre d'une télésurveillance médicale et montrent que les modèles ne sont pas affectés par des opérations complexes.