Développement d'un protocole de contrôle autonome pour un réseau de flottes de drones à l'aide de l'apprentissage automatique
| Auteur / Autrice : | Abdulhakeem Abdulazeez |
| Direction : | Tara Ali Yahiya, Steven Martin, Nicola Roberto Zema |
| Type : | Thèse de doctorat |
| Discipline(s) : | Sciences des réseaux, de l'information et de la communication |
| Date : | Soutenance le 18/12/2024 |
| Etablissement(s) : | université Paris-Saclay |
| Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) |
| Référent : Université Paris-Saclay. Faculté des sciences d’Orsay (Essonne ; 2020-....) | |
| graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….) | |
| Jury : | Président / Présidente : Stefano Secci |
| Examinateurs / Examinatrices : André-Luc Beylot, Khaled Boussetta, Véronique Vèque | |
| Rapporteurs / Rapporteuses : André-Luc Beylot, Khaled Boussetta |
Résumé
Dans le contexte de la robotique en réseau sans fil, des missions complexes, telles que la recherche et le sauvetage autonomes, peuvent nécessiter l’utilisation de plusieurs véhicules aériens sans pilote (UAV) déployés en formation afin d’augmenter l’efficacité et la qualité de service (QoS) tout en garantissant des impératifs spécifiques à la mission, tels que la maximisation de la couverture d’une zone en un seul passage de la flotte sur des sous-sections de celle-ci. Pour relever ces défis, un protocole efficace de localisation et de contrôle de formation est nécessaire.Les solutions existantes proposées pour la localisation à faible coût des UAV utilisant les valeurs de l’indicateur de puissance du signal reçu (RSSI) ont été conçues pour des environnements intérieurs, en réponse à la limitation du Global Navigation Satellite System (GNSS) en intérieur, ce qui les rend inapplicables aux environnements extérieurs.Celles développées pour fonctionner en extérieur sont soit inadaptées aux nœuds mobiles, soit inapplicables aux dispositifs aériens déployés dans des environnements complexes avec des effets de propagation variables. De plus, les protocoles de contrôle existants spécifiquement conçus pour le contrôle autonome des flottes de drones ne tiennent pas compte de l’orientation de la formation.Afin de couvrir ces aspects, cette thèse propose un protocole de contrôle de formation basé sur l’apprentissage, comprenant trois mécanismes de contrôle pour aborder les questions d’estimation de distance en extérieur, d’adaptation de la vitesse et d’orientation de la formation. Le protocole adapte le principe d’apprentissage par renforcement multi-agents (MARL) pour autopiloter la structure leader-suiveur de la flotte de drones en utilisant uniquement les valeurs RSSI reçues par les UAV lors des communications sans fil avec leursvoisins. Les suiveurs doivent suivre le leader tout en maintenant la structure leader-suiveur préconfigurée de manière autonome. Tout d’abord, un estimateur de distance basé sur un réseau de neurones profonds (DNN) utilisant le RSSI a été développé pour fournir des estimations plus précises de la distance entre n’importe quelle paire d’UAV en formation afin d’améliorer la localisation. L’estimateur a été entraîné à l’aide d’un ensemble de données collectées par simulation pour diverses configurations de formation en termes de vitesse, d’altitude, de tailles de formation et de modèles de perte de propagation. Le deuxième protocole traite du problème de l’adaptation de la vitesse en utilisant le principe basé sur le MARL, intégrant l’estimateur de distance basé sur le RSSI pour le calcul des distances. Les suiveurs sont formés par l’expérience collective de l’environnement pour ajuster leur vitesse de manière autonome par rapport à celle du leader lors d’un mouvement linéaire. Pour résoudre le problème d’alignement de l’orientation, un protocole de détection de direction et d’alignement de formation a été développé en utilisant le principe basé sur le MARL. Comme l’adaptateur de vitesse, ce protocole intègre également l’estimateur de distance. Les drones suiveurs sont entraînés à détecter la direction de vol du leader et à tourner comme un corps rigide autour de l’axe de lacet pour se réaligner sur le leader. Nous avons implémenté le protocole en utilisant NS3-3.35 intégré à la bibliothèque d’apprentissage automatique mlpack et évalué ses performances à travers plusieurs essais expérimentaux. Les résultats démontrent que le protocole atteint de meilleures performances en termes d’erreur estimée de distance tolérable, de stabilité de formation, d’erreur de déviation de formation et de temps de réponse accru.