Estimation distribuée respectueuse de la consommation d’énergie et de la confidentialité sur les réseaux adaptatifs

par Ibrahim El Khalil Harrane

Thèse de doctorat en Sciences pour l'ingénieur

Sous la direction de Cédric Richard et de Rémi Flamary.

Soutenue le 21-06-2019

à l'Université Côte d'Azur (ComUE) , dans le cadre de École doctorale Sciences fondamentales et appliquées (Nice) , en partenariat avec Université de Nice (1965-2019) (établissement de préparation) , Laboratoire Joseph-Louis Lagrange (Nice, Alpes-Maritimes) (laboratoire) et de Joseph Louis LAGRANGE (laboratoire) .

Le président du jury était Jean-Yves Tourneret.

Le jury était composé de Jean-Yves Tourneret, David Brie, Olivier Michel, Frédéric Pascal, Alain Rakotomamonjy.

Les rapporteurs étaient David Brie, Olivier Michel.


  • Résumé

    L’estimation adaptative distribuée sur les réseaux tire parti des interconnexions entre agents pour effectuer une tâche d’estimation de paramètres à partir de flux continus de donnée. Comparées aux solutions centralisées, les stratégies distribuées sont robustes aux pertes de communications ou aux défaillances des agents. Cependant, ces avantages engendrent de nouveaux défis. Les stratégies distribuées nécessitent une communication permanente entre agents voisins, engendrant un coût considérable, en particulier pour les agents dont le budget énergétique est limité. Au-delà du coût de communication, comme pour tout algorithme distribué, on peut craindre des problèmes de confidentialité, en particulier pour les applications impliquant des données sensibles. L’objectif de cette thèse est de répondre à ces deux défis. Pour réduire le coût de communication et par conséquent la consommation d’énergie, nous proposons deux stratégies. La première repose sur la compression tandis que la seconde vise à limiter les coûts de communication en considérant un réseau moins dense. Pour la première approche, nous proposons une version compressée du diffusion LMS dans laquelle seules quelques composantes des vecteurs de données partagés, sélectionnées aléatoirement, sont transmises. Nous effectuons une analyse théorique de l’algorithme ainsi que des simulations numériques pour confirmer la validité du modèle théorique. Nous effectuons aussi des simulations selon un scénario réaliste dans lequel les agents s’allument et s’éteignent pour économiser les ressources énergétiques. L’algorithme proposé surpasse les performances des méthodes de l’état de l’art. La seconde approche exploite l’aspect multitâche pour réduire les coûts de communication. Dans un environnement multitâche, il est avantageux de ne communiquer qu’avec des agents qui estiment des quantités similaires. Pour ce faire, nous considérons un réseau avec deux types d’agents : des agents de cluster estimant la structure du réseau et des agents réguliers chargés d’estimer leurs paramètres objectifs respectifs. Nous analysons théoriquement le comportement de l’algorithme dans les deux scénarios : l’un dans lequel tous les agents sont correctement groupés et l’autre dans lequel certains agents sont affectés au mauvais cluster. Nous effectuons une analyse numérique approfondie pour confirmer la validité des modèles théoriques et pour étudier l’effet des paramètres de l’algorithme sur sa convergence. Pour répondre aux préoccupations en matière de confidentialité, nous nous sommes inspirés de la notion de "differential privacy" pour proposer une version du diffusion LMS prenant en compte la confidentialité des données. Sachant que le diffusion LMS repose sur la communication entre agents, la sécurité des données est constamment menacée. Pour éviter ce risque et tirer profit de l’échange d’informations, nous utilisons des matrices aléatoires de Wishart pour corrompre les données transmises. Ce faisant, nous empêchons la reconstruction des données par les voisins adverses ainsi que les menaces externes. Nous analysons théoriquement et numériquement le comportement de l’algorithme. Nous étudions également l’effet du rang des matrices de Wishart sur la vitesse de convergence et la préservation de confidentialité.

  • Titre traduit

    Energy and privacy aware estimation over adaptive networks


  • Résumé

    Distributed estimation over adaptive networks takes advantage of the interconnections between agents to perform parameter estimation from streaming data. Compared to their centralized counterparts, distributed strategies are resilient to links and agents failures, and are scalable. However, such advantages do not come without a cost. Distributed strategies require reliable communication between neighbouring agents, which is a substantial burden especially for agents with a limited energy budget. In addition to this high communication load, as for any distributed algorithm, there may be some privacy concerns particularly for applications involving sensitive data. The aim of this dissertation is to address these two challenges. To reduce the communication load and consequently the energy consumption, we propose two strategies. The first one involves compression while the second one aims at limiting the communication cost by sparsifying the network. For the first approach, we propose a compressed version of the diffusion LMS where only some random entries of the shared vectors are transmitted. We theoretically analyse the algorithm behaviour in the mean and mean square sense. We also perform numerical simulations that confirm the theoretical model accuracy. As energy consumption is the main focus, we carry out simulations with a realistic scenario where agents turn on and off to save energy. The proposed algorithm outperforms its state of the art counterparts. The second approach takes advantage of the multitask setting to reduce the communication cost. In a multitask setting it is beneficial to only communicate with agents estimating similar quantities. To do so, we consider a network with two types of agents: cluster agents estimating the network structure, and regular agents tasked with estimating their respective objective vectors. We theoretically analyse the algorithm behaviour under two scenarios: one where all agents are properly clustered, and a second one where some agents are asigned to wrong clusters. We perform an extensive numerical analysis to confirm the fitness of the theoretical models and to study the effect of the algorithm parameters on its convergence. To address the privacy concerns, we take inspiration from differentially private Algorithms to propose a privacy aware version of diffusion LMS. As diffusion strategies relies heavily on communication between agents, the data are in constant jeopardy. To avoid such risk and benefit from the information exchange, we propose to use Wishart matrices to corrupt the transmitted data. Doing so, we prevent data reconstruction by adversary neighbours as well as external threats. We theoretically and numerically analyse the algorithm behaviour. We also study the effect of the rank of the Wishart matrices on the convergence speed and privacy preservation.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Côte d'Azur. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.