Thèse soutenue

Apprentissage fédéré sécurisé et préservant la confidentialité avec intelligence artificielle explicable pour les systèmes intelligents dans le domaine de la santé

FR  |  
EN
Auteur / Autrice : Ali Raza
Direction : Ludovic KoehlShujun LiKim Phuc Tran
Type : Thèse de doctorat
Discipline(s) : Informatique, Automatique
Date : Soutenance le 28/08/2023
Etablissement(s) : Université de Lille (2022-....) en cotutelle avec University of Kent (Canterbury, Royaume-Uni)
Ecole(s) doctorale(s) : Ecole doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille)
Partenaire(s) de recherche : Laboratoire : GEMTEX (Roubaix)
Ecole d'ingénieurs : Ecole nationale supérieure des arts et industries textiles (Roubaix, Nord)
Jury : Président / Présidente : Patrick Siarry
Examinateurs / Examinatrices : Ramla Saddem, Rehmat Ullah
Rapporteurs / Rapporteuses : Patrick Siarry, Hongmei He

Résumé

FR  |  
EN

La croissance de la population à travers le monde a un impact significatif sur divers secteurs, notamment la main-d'œuvre, les soins de santé et l'économie mondiale. Le secteur de la santé est l'un des secteurs les plus touchés par la croissance de la population en raison de la demande croissante en ressources et en installations de santé. Des systèmes intelligents ont été intégrés pour améliorer la prise de décision afin de faire face à ces problèmes et d'offrir des soins de santé améliorés. Parmi ces systèmes, ceux basés sur l'apprentissage en profondeur (DL) ont surpassé de nombreux systèmes statistiques et ML traditionnels grâce à leur capacité à découvrir et à apprendre automatiquement des caractéristiques liées à une tâche donnée. Par conséquent, l'utilisation du DL a connu une augmentation constante dans de nombreuses applications. Néanmoins, généralement, la formation des modèles DL repose sur un seul serveur centralisé, ce qui pose de nombreux défis : (1) à l'exception de quelques grandes entreprises, la plupart des petites entreprises disposent de données de qualité limitée, insuffisantes pour soutenir la formation des modèles DL, (2) l'accès aux données soulève souvent des problèmes de confidentialité. La collecte et l'analyse d'informations sensibles sur les patients doivent être sécurisées et respectueuses de la vie privée pour protéger les droits individuels à la vie privée, (3) coût élevé de communication et de ressources de calcul requis, (4) un grand nombre de paramètres entraînables rendent les résultats du DL difficiles à expliquer, ce qui est requis dans certaines applications.Par rapport au DL centralisé, l'apprentissage fédéré (FL) améliore à la fois la confidentialité et les coûts de communication, où les clients collaborent pour former un modèle commun sans partager directement les données brutes. Le FL réduit au minimum les violations de la confidentialité et protège les données sensibles en les maintenant distribuées localement. Cela permet une formation collaborative du modèle tout en réduisant le risque d'accès non autorisé et de violations de données. De plus, il favorise l'apprentissage collaboratif en ne partageant que les mises à jour du modèle plutôt que l'ensemble des données.Cependant, le FL présente ses propres défis. Par exemple, la nature hétérogène des données locales entre les clients rend difficile la formation d'un modèle global performant et robuste. De plus, la nature distribuée et le contrôle d'accès des données locales dans le FL le rendent plus vulnérable aux attaques malveillantes. De plus, le défi d'expliquer les résultats du DL reste toujours un défi, et des méthodes doivent être développées pour apporter confiance, responsabilité et transparence dans des applications sensibles, telles que les soins de santé.Par conséquent, l'objectif de cette thèse est de créer des cadres robustes, sécurisés, performants et respectueux de la vie privée dans des environnements fédérés. Ces cadres seront spécifiquement conçus pour des applications de santé de bout en bout, en tenant compte de la présence de données non identiquement distribuées entre