Réseaux de neurones à l'échelle nano–Quels modèles d'apprentissage?

par Erwann Martin

Projet de thèse en Physique

Sous la direction de Julie Grollier.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Physique en Île-de-France (Paris) , en partenariat avec Unité mixte de physique CNRS/Thales (Palaiseau) (laboratoire) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-11-2018 .


  • Résumé

    Le domaine de l'Intelligence Artificielle, en plein essor aujourd'hui, est dominé par les méthodes d'apprentissage statistique et notamment les modèles neuronaux profonds, pour des tâches comme : reconnaissance d'objets, traitement naturel des langues, systèmes de recommandations, jeux (notamment le très complexe GO), description de scènes ... Cet apprentissage requièrt des ressources de calcul importantes et extrêmement gourmandes en énergie (dépassant de loin la consommation du cerveau) tout en présentant une capacité d'inférence et de généralisation fortement conditionnées par le nombre et la qualité des exemples d'apprentissage, ou les hypothèses du modèle. Les architectures neuromorphiques visent à se rapprocher du fonctionnement du cerveau en proposant un changement de paradigme par rapport aux architectures Von-Neumann. Couplées avec la recherche en nano-technologies (memristors, nano-oscillateurs à transfert de spin) et l'algorithmique, elles portent la promesse de réaliser des nouvelles puces bien plus efficaces sur le plan énergétique en permettant de s'affranchir du découplage entre les étapes d'apprentissage et d'inférence. L'élaboration de nouveaux algorithmes d'apprentissage y compris non-supervisés et en temps réel spécifiquement conçus pour prendre en compte les caractéristiques physiques de tels réseaux de neurones profonds bio-inspirés, tant au niveau des composants (plages de fonctionnement, variabilité, bruit) que de leur interconnexion, permettrait de pousser cette logique d'efficacité à un niveau vraiment différenciant. Cette recherche d'algorithmes en symbiose avec ces architectures neuromorphiques est l‘objet de la thèse.

  • Titre traduit

    How can artificial neural networks composed of nanodevices learn?


  • Résumé

    Na