Apprentissage autosupervisé pour la découverte de structures complexes dans des images
Auteur / Autrice : | Timothée Darcet |
Direction : | Julien Mairal |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques et Informatique |
Date : | Inscription en doctorat le 21/02/2022 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale mathématiques, sciences et technologies de l'information, informatique |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Jean Kuntzmann |
Equipe de recherche : LEAR : Learning and Recognition in Vision |
Mots clés
Résumé
La plupart des systèmes de vision par ordinateur modernes utilisent des réseaux de neurones, souvent préentrainés sur une tâche différente de celle considérée. La plupart du temps, ces réseaux sont préentrainés sur Imagenet, un jeu de données de classification d'images. Récemment, des nouvelles méthodes utilisent de l'apprentissage autosupervisé pour utiliser des données non annotées, qui sont disponibles en plus grande quantité que les données annotées. La plupart des efforts de recherche en apprentissage autosupervisé s'est concentré sur le développement de méthodes qui permettent d'obtenir des bons résultats sur quelques tâches classiques, comme la classification sur Imagenet. Le défi que nous proposons de relever est de découvrir des structures plus complexes que de simples catégories dans les données étudiées. En effet, nous pensons que c'est en tentant de résoudre des tâches plus complexes que la classification que les modèles de vision peuvent obtenir des nouveaux gains de performance. Les structures que nous proposons de découvrir incluent des informations géométriques de scènes, des règles temporelles comme les règles physique, et des informations de relations entre objets ou concepts, comme des relations de causalité.