Bibliométrie, détection de changement et apprentissage multimodal sur des données d'observation de la Terre : le cas de la déforestation
| Auteur / Autrice : | Nathalie Neptune | 
| Direction : | Josiane Mothe | 
| Type : | Thèse de doctorat | 
| Discipline(s) : | Informatique et Télécommunications | 
| Date : | Soutenance le 15/07/2022 | 
| Etablissement(s) : | Toulouse 3 | 
| Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) | 
| Partenaire(s) de recherche : | Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....) - Institut de recherche en informatique de Toulouse / IRIT | 
| Jury : | Président / Présidente : Florence Sèdes | 
| Rapporteurs / Rapporteuses : Mathieu Roche, Muriel Visani | 
Mots clés
Mots clés contrôlés
Résumé
En raison de la déforestation et de la dégradation affectant de nombreuses zones forestières, il est nécessaire de détecter et de surveiller l'état des forêts. Dans cette thèse, nous présentons des méthodes automatiques pour analyser des images satellites et des documents scientifiques, séparément et conjointement, pour détecter la déforestation. Ce travail, appliqué à la déforestation, reste générique et peut s'appliquer à d'autres domaines dans lesquels des images d'observation peuvent être annotées à partir de publications au sujet du phénomène à annoter. Nous présentons notre travail d'analyse des publications liées à la déforestation couvrant plusieurs décennies. Nos méthodes offrent une nouvelle approche prometteuse pour l'analyse des données environnementales afin d'étudier à grande échelle des informations sur la déforestation ou d'autres sujets. Nous proposons d'extraire les meilleurs mots-clés d'un corpus de publications scientifiques sur un même sujet, après avoir retiré les documents les moins pertinents de ce corpus en fonction de leur titre. Pour ce faire, nous utilisons des plongements de phrases et des mesures de similarité sémantique. En utilisant notre approche sur les corpus liés à la déforestation, nous obtenons les meilleurs mots-clés principalement liés à ce sujet. Nous proposons d'annoter des paires d'images satellites de forêts ayant subi des changements, avec des mots-clés de publications scientifiques. Les paires d'images sont annotées avec les mots qui leur ressemblent le plus. Nous utilisons une représentation commune des images et des mots-clés extraits des publications, à l'aide de réseaux de neurones. Nous trouvons les mots-clés les plus similaires à la paire d’images dans cet espace commun avec la mesure de similarité du cosinus. Avec notre approche, nous constatons que les corpus qui sont liés aux forêts en général, et à la région d'intérêt plus spécifiquement, peuvent être utilisés pour annoter automatiquement et de façon pertinente les images. Nous montrons que ces corpus donnent de meilleurs résultats que l'utilisation d'un corpus plus générique comme Wikipedia.