Classification d'images satelllite par méthodes d'ensemble semi-supervisées. Application à la cartographie de sites naturels

par Wenjing Ma

Projet de thèse en Sciences de la terre et de l'atmosphere

Sous la direction de Samia Boukir.

Thèses en préparation à Bordeaux 3 , dans le cadre de Montaigne-Humanités , en partenariat avec Géoressources (EA4592) (equipe de recherche) et de INP Bordeaux depuis le 30-11-2015 .


  • Résumé

    De nos jours, une quantité considérable de données de télédétection est générée quotidiennement. La grande majorité de ces données sont non étiquetées, entraînant des difficultés dans l’utilisation d’approches supervisées pour la classification automatique de ces données. Typiquement, l’étiquetage ne concerne qu’une très faible partie des données disponibles. L’apprentissage semi-supervisé est un domaine de recherche relativement récent qui vise à exploiter conjointement et automatiquement les échantillons étiquetés et non étiquetés disponibles pour concevoir un modèle de classification performant en présence d’un faible nombre de données de référence. La classification semi-supervisée et la classification multiple sont deux paradigmes importants ayant le même objectif : obtenir la meilleure précision de classification possible mais avec deux stratégies complètement différentes. La première mise sur l’exploitation des données non étiquetées et la seconde sur la combinaison d’un ensemble de classifieurs. Néanmoins, la combinaison de ces deux philosophies a été très peu abordée dans la littérature. L'objectif de ce travail est, d'un point de vue méthodologique : le développement d'une méthode originale de classification par méthode d’ensemble semi-supervisée à partir d’images satellite de Très Haute Résolution spatiale. Cette approche vise à combiner deux paradigmes puissants : la classification multiple et la classification semi-supervisée. D'un point vue applicatif, il s’agit d’évaluer la capacité de l'approche proposée à être appliquée à la cartographie de l’occupation du sol dans un contexte nécessitant une description fine des faciès composant l’écosystème observé, notamment en domaine littoral, en présence d’un nombre réduit de données étiquetées.

  • Titre traduit

    Classification of satellite images using semi-supervised ensemble methods. Application to natural site mapping


  • Résumé

    Nowadays, an enormous amount of remotely sensed data is being generated every day. Most of these data is uncategorised, making difficult the use of supervised approaches to automate the classification of these data. Typically, there is only a small amount of labelled data available. Semi-supervised learning is a relatively new field which aims at exploiting unlabelled data in addition to labelled data automatically to build efficient classification systems that use a small amount of labelled data. Semi-supervised learning and ensemble learning are two important learning paradigms with the same objective: achieving the best possible classification accuracy, but with completely different strategies. The former relies on exploiting unlabelled data while the latter relies on using multiple learners. However, the machine learning community has not paid sufficient attention to the combination of these two philosophies. The main objective of this work is: developing an original classification method based on semi-supervised ensemble learning using Very High Resolution satellite images. This approach aims at combining two powerful paradigms: multiple classification and semi-supervised classification. The main application of interest is: land use mapping in a context requiring a fine description of the facies composing the observed ecosystem, in particular coastal environments, with a critical amount of labelled data.