Thèse soutenue

Immersion dans le Web sémantique de découpages géographiques en évolution
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Camille Bernard
Direction : Jérôme GenselQuoc-Hy Dao
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 27/11/2019
Etablissement(s) : Université Grenoble Alpes (ComUE)
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique de Grenoble
Equipe de recherche : STEAMER
Jury : Président / Présidente : Sihem Amer-Yahia
Examinateurs / Examinatrices : Jérôme Gensel, Quoc-Hy Dao, Marlène Villanova-Oliver, Christophe Cruz, Thérèse Libourel
Rapporteurs / Rapporteuses : Christophe Claramunt, Nathalie Aussenac-Gilles

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

De nos jours, le volume de données provenant du secteur public augmente rapidement dans le Web des données ouvertes. La plupart des données proviennent d’organismes gouvernementaux tels que des instituts officiels de statistique et de cartographie. Ensemble, ces institutions publient des statistiques géo-codées qui revêtent une importance capitale pour que les responsables politiques mènent diverses analyses de leur territoire, dans le temps et dans l’espace. Cependant, au cours du temps et partout dans le monde, les divisions (administratives ou électorales par exemple) de ces territoires (portions d’espace sur la terre) délimités par des groupes humains (ou sous le contrôle de groupes humains) sont sujettes à modifications : leur nom, appartenance ou leurs frontières changent pour des raisons politiques ou administratives. De même, les Nomenclatures Statistiques Territoriales (acronyme TSN en anglais), qui regroupent différentes zones géographiques, artefacts construits par des instituts statistiques mais dérivant généralement de structures électorales ou administratives, changent dans le temps et à plusieurs niveaux du territoire (e.g., régions, départements, communes, etc.). Ces changements sont un obstacle à la comparabilité des données socio-économiques dans le temps, celle-ci n’étant possible qu’à la condition d’estimer les données dans un même découpage géographique, un processus compliqué qui finit par masquer les changements territoriaux. Ces changements territoriaux entraînent donc des ruptures dans les séries statistiques et sont à l’origine d’interprétations erronées ou de biais statistiques lorsqu’ils ne sont pas correctement documentés. Par conséquent, des solutions pour représenter différentes versions de TSNs et leurs évolutions dans le Web des Données Ouvertes doivent être proposées afin d’améliorer la compréhension des dynamiques territoriales.Dans cette thèse, nous présentons un cadriciel nommé Theseus Framework. Theseus adopte les technologies du Web sémantique et représente les découpages géographiques et leurs évolutions au cours du temps sous forme de données ouvertes et liées (Linked Open Data (LOD) en anglais). Theseus est composé d’un ensemble de modules permettant la gestion du cycle de vie des TSNs dans le LOD Web : de la modélisation des zones géographiques et de leurs changements au cours du temps, à la détection automatique des changements et à l’exploitation de ces descriptions dans le LOD Web. L’ensemble des modules logiciels reposent sur deux ontologies nommées TSN Ontology et TSN-Change Ontology, que nous avons conçues pour une description non ambiguë des zones géographiques dans le temps et dans l’espace, ainsi que pour la description de leurs modifications au cours du temps.Ce cadriciel s’adresse tout d’abord aux agences statistiques, car il facilite considérablement la mise en conformité de leurs données géographiques, support à l’information statistique avec les directives Open Data. De plus, les graphes de données liées créés améliorent la compréhension des dynamiques territoriales au cours du temps, en fournissant aux décideurs politiques, aux chercheurs et au grand public des descriptions sémantiques des changements territoriaux afin de réaliser diverses analyses de leur territoire. L’applicabilité et la généricité de notre approche sont illustrées par trois tests du cadriciel Theseus menés sur trois TSN officielles : La Nomenclature européenne des unités territoriales statistiques (versions 1999, 2003, 2006 et 2010) de Institut statistique Européen Eurostat; les unités administratives suisses de l’Office fédéral de la statistique Suisse, décrivant les cantons, districts et communes de la Suisse en 2017 et 2018 ; l’Australian Statistical Geography Standard, construit par le Bureau australien de la statistique, composé de sept divisions imbriquées du territoire australien, dans les versions 2011 et 2016.