Support vector machines et méthodes bayésiennes pour l'apprentissage sémantique fondé sur des catégories : recherche dans les bases de données d'imagerie satellitaire

par Mihai Costache

Thèse de doctorat en Signal et images

Sous la direction de Henri Maître et de Mihai Datcu.

Soutenue en 2008

à Paris, ENST .


  • Résumé

    De grands volumes de données multimédias sont disponibles avec la source représentée par l'activité humaine dans différents domaines comme la photographie et les applications de la télédétection, etc. Pour l'ensemble de ces données, il est absolument nécessaire d'avoir des outils et des méthodes permettant une organisation et une utilisation optimales des données, afin que l'accès au contenu puisse être fait d'une manière rapide et efficace. Le nombre de satellites opérationnels augmente chaque année et génère une explosion du volume de données acquises. Par exemple, entre 10 à 100 Gigaoctets de données d'image sont en moyenne enregistrées chaque jour par des capteurs optiques et radar embarques. Le satellite ESA de l'environnement, Envisat, lance 2002 recueille environ 18 Téraoctets de données par année. Les données générées sont traitées manuellement par des experts spécialisés dans chaque domaine d'application en télédétection. Toutefois, ce type d'analyse est coûteux et prend du temps. De plus, il permet le traitement d' une petite fraction de données disponibles, à un rythme beaucoup plus faible que celui dans lequel les images enregistrées sont envoyées au sol. Pour faire face à ces deux principaux aspects de la télédétection, il est clair qu'il faut des outils très efficaces pour la recherche par contenu dans des archives satellitaires. Ils doivent être en mesure d'identifier et de reconnaître des structures dans les images. Ces systèmes doivent être rapides et fonctionner avec une grande précision. Un tel système a pour objectif d'automatiquement effectuer la classification des images numériques disponibles, sur la base d'une formation préalable, qui est supervisisée par un expert. Ainsi, la base de données est mieux organisée et des images d'intérêt peuvent être identifiées plus facilement plutôt que par l'emploi d'une interprétation manuelle d'experts. La tâche consiste à déduire des connaissances par le biais de l'interaction homme-machine. L'interaction entre un système automatique et un expert humain permet le transfert de l'expertise humaine à la machine par le biais d'algorithmes d'inférence de connaissances capable d'interpréter la décision humaine et de le traduire en conceptuel. De cette manière, le processus d'extraction d'information dans des données satellitaires est automatisé, ce qui permet une réponse rapide aux requêtes de l'utilisateur. Dans le domaine de la recherche par contenu il y a beaucoup de travaux mais peu dans le domaine satellitaire. Dans cette thèse nous proposons un système complet d'annotations d'images satellitaires par le contenu et par mots clés. Du point de vue des techniques d'apprentissage, une combinaison entre les SVM et les formalismes de Bayes peut être établie pour la génération de classe sémantique et catégorique en fonction de la représentation de données. L'apprentissage se fait sur la base d'un dialogue homme-machine qui est essentiel dans le processus de transfert de connaissances entre l'expert et le système. La combinaison des formalismes SVM et Bayésienne est une contribution originale de la thèse.

  • Titre traduit

    Support vectormachines and Bayesian methods for category-based semantic learning : a search engine for image satellite database


  • Résumé

    Nowadays large volumes of multimedia data are available with the source being represented by different human activity domains such as photography, television channels, remote sensing applications, etc. For all these data there is a clear need for tools and methods which can allow an optimal data organisation so that the access to the content can be done in a fast and efficient manner. The number of operational EO satellites increases every year and generates an explosion of the acquired data volume. Nowadays, for instance, on average somewhere between 10 to 100 Gigabytes of image data are recorded daily on regular basis by the available optical and Synthetic Aperture Radar (SAR) sensors on board of the EO satellites. ESA's Environmental Satellite, Envisat, deployed in 2002 collects per year around 18 Terabytes of multisensor data. This leads to a total of about 10 Terabytes of annually recorded data volume which is representing a huge volume of data to be processed and interpreted. The generated data volume in classical remote sensing applications, are treated manually by specialised experts for each domain of application. However, this type of analysis is costly and time consuming. Moreover, it allows the processing of only a small fraction of the available data as the user-based image interpretation is done at a greatly lower pace that the one in which the recorded images are sent to the ground stations. In order to cope with these two major aspects in remote sensing, there is a clear need for highly efficient search tools for EO image archives and for search mechanisms able to identify and recognise structures within EO images; moreover these systems should be fast and work with high precision. Such a system should automatically perform classification of the available digital image collection, based on a previous training, which was supervised by an expert. In this way, the image database is better organized and images of interest can be identifed more easily than just by employing a manual expert image interpretation. The task is to infer knowledge, by means of human-machine interaction, from EO image archives. The human-machine interaction enables the transfer of human expertise to the machine by means of knowledge inference algorithms which interpret the human decision and to translate it into conceptual levels. In this way, the EO image information search and extraction process is automated, allowing a fast reponse adapted to human queries.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (216 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 136 réf. bibliogr. Résumé en anglais. Résumé étendu en français

Où se trouve cette thèse ?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
  • Cote : 7.345 COST
  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Consultable sur place dans l'établissement demandeur
  • Cote : 7.345 COST
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.