Thèse en cours

Apprentissage autosupervisé pour la découverte de structures complexes dans des images

FR  |  
EN
Auteur / Autrice : Timothée Darcet
Direction : Julien Mairal
Type : Projet de thèse
Discipline(s) : Mathématiques et Informatique
Date : Inscription en doctorat le 21/02/2022
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Kuntzmann
Equipe de recherche : LEAR : Learning and Recognition in Vision

Résumé

FR  |  
EN

La plupart des systèmes de vision par ordinateur modernes utilisent des réseaux de neurones, souvent préentrainés sur une tâche différente de celle considérée. La plupart du temps, ces réseaux sont préentrainés sur Imagenet, un jeu de données de classification d'images. Récemment, des nouvelles méthodes utilisent de l'apprentissage autosupervisé pour utiliser des données non annotées, qui sont disponibles en plus grande quantité que les données annotées. La plupart des efforts de recherche en apprentissage autosupervisé s'est concentré sur le développement de méthodes qui permettent d'obtenir des bons résultats sur quelques tâches classiques, comme la classification sur Imagenet. Le défi que nous proposons de relever est de découvrir des structures plus complexes que de simples catégories dans les données étudiées. En effet, nous pensons que c'est en tentant de résoudre des tâches plus complexes que la classification que les modèles de vision peuvent obtenir des nouveaux gains de performance. Les structures que nous proposons de découvrir incluent des informations géométriques de scènes, des règles temporelles comme les règles physique, et des informations de relations entre objets ou concepts, comme des relations de causalité.