Thèse soutenue

Apprentissage distribué pour la gestion et l'orchestration des réseaux 5G et au-delà

FR  |  
EN
Auteur / Autrice : Mohamed Sana
Direction : Emilio Calvanese Strinati
Type : Thèse de doctorat
Discipline(s) : Mathématiques et Informatique
Date : Soutenance le 26/10/2021
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'électronique et de technologie de l'information (Grenoble ; 1967-....)
Jury : Président / Présidente : Denis Trystram
Examinateurs / Examinatrices : Mérouane Debbah, Petar Popovski
Rapporteurs / Rapporteuses : Sergio Barbarossa, Deniz Gunduz

Résumé

FR  |  
EN

Les communications sans fil connaissent une demande sans précédent de débit et de bande passante. Non seulement le volume du trafic de données explose, mais les spécificités et la nature des objets communicants se diversifient. De plus, l’apparition de nouvelles applications et de nouveaux cas d'utilisation, chacun avec des exigences strictes, complexifie la gestion des ressources radio, de calcul, et de stockage, qui nécessite désormais des solutions avancées, flexibles, évolutives et peu complexes.Cette thèse se focalise sur les approches d'apprentissage distribué pour une gestion efficace et efficiente des ressources radio des réseaux mobiles 5G et au-delà. Les solutions distribuées ont l’avantage d’être flexibles, évolutives et robustes face aux perturbations ambiantes. En outre, elles réduisent la surcharge de signalisation et limitent des calculs centralisés laborieux. Cependant, l'apprentissage distribué fait face à plusieurs défis, notamment dans les réseaux 5G denses, en raison d'un environnement sans fil incertain et des ressources radio et de calcul limitées. Motivés par ces défis, nous proposons de nouveaux cadres d'apprentissage distribué basés sur l'apprentissage par renforcement multi-agent, tenant compte de la dynamique de l'environnement (variations des canaux sans fil, interférences intra et intercellulaires, trafic et mobilité des utilisateurs) pour une gestion dynamique des ressources radio. Plus précisément, notre approche modélise les équipements utilisateur comme des agents indépendants, qui collaborent (ou rivalisent) pour accéder à des ressources radio et/ou computationnelles afin d'optimiser des fonctions d'utilité du réseau. Pour cela, les agents s'appuient sur leurs observations locales (et sur d’éventuelles observations globales) pour prendre des décisions autonomes, réduisant ainsi considérablement les coûts de signalisation et de calcul.Ce faisant, un cadre d'association d'utilisateurs entièrement distribué et décentralisé est d’abord proposé pour l'affectation optimale des équipements utilisateurs aux stations de base, et pour gérer la mobilité. Nous étendons ensuite cette étude pour proposer une nouvelle architecture combinant judicieusement des mécanismes d'attention neuronale et d'apprentissage par renforcement multi-agent. Les solutions obtenues sont entièrement transférables et généralisables : les connaissances acquises dans un scénario spécifique sont applicables à d’autres sans nécessiter de procédure d’apprentissage supplémentaire. Nous montrons que cette solution s'adapte bien aux variations du nombre et des positions des utilisateurs. Cela nous permet ensuite d'aborder le problème du déchargement dynamique des calculs à faible coût énergétique, où plusieurs utilisateurs se disputent des ressources radio et computationnelles pour décharger des tâches sur un serveur périphérique. Il s’agit d’un problème de minimisation d'énergie à long terme sous des contraintes strictes de délai. Avec des outils d'optimisation stochastique de Lyapunov, nous traduisons ce problème en un problème d'allocation conjointe de fréquence et de ressources radio par slot, que nous résolvons de manière quasi-optimale avec un algorithme itératif rapide combiné à notre solution d’association d’utilisateurs transférable. Enfin, la dernière partie de cette thèse explore les communications sémantiques. Dans ce paradigme, lorsqu'une communication a lieu pour véhiculer un sens entre deux agents, ce qui importe est la compréhension par le récepteur du message transmis et non sa reconstruction correcte. Transmettre uniquement les informations pertinentes suffisantes pour que les agents saisissent le sens voulu permet d’énormes économies de bande passante. Nous proposons donc une méthode permettant l'apprentissage de la représentation des symboles sémantiques. Nos résultats numériques préliminaires sont prometteurs et montrent le potentiel des communications sémantiques pour des futurs réseaux 6G efficaces et durables.