Analyse de données longitudinales multivariées, sparses, avec co-variables mixtes, issues d'objets médicaux connectés.
Auteur / Autrice : | Violaine Courrier |
Direction : | Christophe Biernacki, Cristian Preda |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques et leurs interactions |
Date : | Inscription en doctorat le 28/08/2023 |
Etablissement(s) : | Université de Lille (2022-....) |
Ecole(s) doctorale(s) : | MADIS Mathématiques, sciences du numérique et de leurs interactions |
Partenaire(s) de recherche : | Laboratoire : INRIA - Institut national de recherche en informatique et en automatique Lille Nord Europe |
Equipe de recherche : INRIA-PAINLEVE |
Mots clés
Mots clés libres
Résumé
La société Withings a accumulé aujourd'hui une masse de données conséquente sur ses nombreux utilisateurs de par le monde pour ses objets médicaux connectés. L'analyse de ces données permettrait non seulement de mieux connaître ces utilisateurs (aspect clustering ou classification non supervisée) mais aussi de prévenir de potentiels risques médicaux pour ces derniers (aspect prédictif). Cependant, l'analyse de ces données s'avère hors de portée des méthodes classiques puisque elles se composent de séries temporelles à la fois multivariées (poids, composition corporelle, etc.) et sparses (dues à des périodes parfois de grande latence d'utilisation des objets), combinée à des informations (co-variables) fixes comme le sexe, l'âge, etc. Cette thèse reposera sur des extensions significatives et non triviales des mélanges de processus gaussiens, ces derniers ayant fait leur preuve dans des travaux très récents dans le cadre de données longitudinales univariées, au cas des nouvelles de données rencontrées chez Withings.