Thèse soutenue

Vers des algorithmes d'apprentissage automatique économes en E/S pour les systèmes embarqués : application aux K-means et Random Forests

FR  |  
EN
Auteur / Autrice : Camélia Slimani
Direction : Jalil Boukhobza
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 11/07/2022
Etablissement(s) : Brest
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance
Jury : Président / Présidente : Frank Singhoff
Examinateurs / Examinatrices : Jalil Boukhobza, Frank Singhoff, Gilles Sassatelli, François Trahay, Stéphane Rubini, Smaïl Niar, Kaoutar El Maghraoui
Rapporteurs / Rapporteuses : Gilles Sassatelli, François Trahay

Résumé

FR  |  
EN

L’abondance des données numériques collectées permet d’alimenter des modèles intelligents, capables d’extraire de la connaissance exploitable par l’humain. L’entraînement de ces modèles, par des algorithmes de Machine Learning, requiert d’importantes ressources de calcul, de mémoire et de stockage. Par conséquent, cette tâche est effectuée sur des calculateurs puissants, ce qui nécessite le transfert des données des dispositifs de collecte, vers les calculateurs. Pour s’affranchir des coûts de communications, le paradigme de l’Edge Intelligence (EI) émerge, et rapproche l’intelligence au plus près des dispositifs de collecte. L’EI soulève de nombreux défis scientifiques, notamment l’exécution des algorithmes de ML sous des contraintes temporelles, énergétiques, et d’espace mémoire, présentes sur les dispositifs embarqués. Nous nous intéressons particulièrement à la contrainte d’espace en mémoire principale. Cet espace sur les dispositifs de collecte est limité et peut être insuffisant pour contenir les données d’apprentissage. Lorsque le volume de données à traiter est supérieur à l’espace mémoire disponible, le système d’exploitation utilise le mécanisme de swap afin d’étendre l’espace mémoire disponible par une partie du stockage secondaire. Par conséquent, l’exécution de la phase d’apprentissage est ralentie par les accès au stockage secondaire (E/S), bien plus lents que ceux à la mémoire principale. Notre objectif est d’analyser le motif des E/S des algorithmes de ML, de déterminer son origine, et de proposer une méthode de réduction des E/S pour accélérer ces algorithmes sur des plateformes embarquées. Nous nous sommes intéressés à deux cas d’études algorithmiques qui sont : le K-MEANS et les RANDOM FORESTS. En résumé, nous avons montré à travers deux exemples, que la révision des algorithmes permet de faire face à l’augmentation du volume de données d’apprentissage en réduisant le volume des E/S. L’extension de cette démarche à d’autres algorithmes/familles d’algorithmes de ML pourrait faire l’objet de travaux futurs.