Interconnexion et visualisation de ressources géoréférencées du Web de données à l'aide d'un référentiel topographique de support.

par Abdelfettah Feliachi

Projet de thèse en Sciences et Technologies de l'Information Géographique

Sous la direction de Benedicte Bucher.

Thèses en préparation à Paris Est , dans le cadre de MSTIC : Mathématiques et Sciences et Technologies de l'Information et de la Communication , en partenariat avec LaSTIG -Laboratoire en Sciences et Technologies de l'Information Géographique (laboratoire) depuis le 25-11-2013 .


  • Résumé

    De récentes démarches politiques et avancées technologiques ont conduit à la mise à disposition de jeux de données produits par les administrations et les collectivités locales (ex: http://www.data.gouv.fr/, http://data.lacub.fr/ ) afin de favoriser l'information des citoyens et la création de nouveaux services. La valorisation de ces diverses sources de données nécessite de faciliter leur réutilisation au sein d'applications, en particulier leur croisement entre elles. Sur le Web, l'initiative du LOD (Linked Open Data : http://linkeddata.org/) encourage la publication de jeux de données libres conformes à un modèle permettant le croisement de données entre elles. Ce modèle technique est utilisé par exemple en France, pour la publication de jeux de données de l'IGN (http://data.ign.fr/), de l'INSEE (http://rdf.insee.fr/), ou encore de la BNF(http://data.bnf.fr/). Parmi les données disponibles, de nombreuses ressources font référence, de façon directe ou indirecte, à une localisation. Cette composante spatiale des données constitue l'un des critères privilégiés pour leur interconnexion avec d'autres sources de données ou encore leur valorisation au travers d'applications cartographiques (citons par exemple le site réalisé à l'aide de données issues de data.gouv.fr: http://www.hicnunc.mobi/j_aime_ma_gare/). Rendre accessibles et utilisables ensemble des données décrivant les territoires a conduit la Commission Européenne à instaurer la directive INSPIRE pour la mise en place d'une infrastructure de données géographiques européenne (SDI, Spatial Data Infrastructures). Par rapport à l'approche Linked Data, l'approche adoptée dans le cadre d'INSPIRE a d'avantage mis l'accent sur l'harmonisation des schémas et le traitement des géométries, afin de permettre la création d'un jeu de données géographiques harmonisé. Dans ce contexte, permettre l'intégration de données au modèle Linked data avec un référentiel géographique (le Référentiel à Grande Échelle de l'IGN) constitue un enjeu important pour favoriser l'interconnexion et la valorisation des données ainsi publiées. Ce travail de thèse consistera donc dans un premier temps à proposer et mettre en oeuvre une approche pour l'intégration de données au modèle Linked data avec le Référentiel à Grande Échelle : - Mise à profit des ontologies décrivant les données afin d'en tirer des indications sur le type de géoréférencement utilisé, la représentation éventuelle des géométries, ou encore le système de coordonnées utilisé. - Reconstitution de géométries cartographiables à partir de ces données (géométries fournies par les données ou géocodage). Un verrou important au croisement des sources de données disponibles sur le Web est la bonne représentation formelle du positionnement, ce que nous appelons "la sémantique du X, Y". Il conviendra donc de proposer une représentation efficace de l'information de positionnement : quel est le lien entre une géométrie et l'élément du terrain réel qu'elle représente (contour d'un bâtiment, centre d'un carrefour) ou encore quelle est la relation qui lie un objet thématique à un objet topographique (un service public hébergé dans un bâtiment) ? Ces connaissances ainsi formalisées devront ensuite être mises à profit dans le cadre d'une approche d'interconnexion de données utilisant le Référentiel à Grande Échelle comme source de données de support. Enfin, parmi les applications découlant de cette intégration de linked data avec un référentiel géographique, leur visualisation cartographique permet leur mise en valeur en fournissant aux utilisateurs un moyen de découverte convivial de ces données. Quelques applications de ce type existent déjà, mais se limitent à positionner des points sur un fond cartographique . La mise à profit des ontologies décrivant les données pour proposer des solutions de visualisation cartographique adaptées sera donc étudiée. On s'intéressera en particulier à l'utilisation de la sémantique des données pour leur généralisation.

  • Titre traduit

    Interlinking and visualizing georeferenced resources of the Web of data with geographic reference data


  • Résumé

    Recent policy initiatives and technological advances have led to providing data sets produced by the government and local authorities (eg http://www.data.gouv.fr/, http: //data.lacub. com /) to promote citizen information and the creation of new services. The valuation of these various data sources require easy reuse in applications, particularly where they cross each other. On the Web, the initiative of the LOD (Linked Open Data: http://linkeddata.org/) encourages the publication of free data conforming to a model of links between them. This technology is used for example in France for publishing datasets IGN (http://data.ign.fr/), INSEE (http://rdf.insee.fr/) , or BNF (http://data.bnf.fr/). Among the data available, many resources refer, directly or indirectly, to a location. This spatial component of data is one of the preferred criteria for interlinking with other data sources or their valuation through mapping applications (eg include the site created using data from data.gouv .com: http://www.hicnunc.mobi/j_aime_ma_gare/). Making accessible and usable the data describing the territories has led the European Commission to implement the INSPIRE directive for the establishment of a European spatial data infrastructure (SDI, Spatial Data Infrastructures). Compared to the Linked Data approach, the approach adopted in the context of INSPIRE emphasized the harmonization of schemes and the processing geometries to enable the creation of a Harmonised geographical datasets . In this context, allowing data integration in Linked data model with a geographic reference (the Large Scale Referential -RGE- of IGN) is an important issue to enhance the interlinking and the valorization of the data. Therefore, this work will be a first step to propose and implement an approach for data integration Linked data model with the Large Scale Reference: - Building on ontologies that describes the data in order to obtain information on the type of georeferencing used, the possible representation of geometries, or the coordinate system used. - Reconstruction of mappable geometries from these data (geometries provided directl as data or by geocoding). An important issue whilr interlinking the data sources available on the Web is the right positioning formal representation, what we call "the semantics of the X, Y". so one should propose an effective representation of the spatial references: what is the relationship between a geometry and the element of real terrain it represents (outline of a building, the center of a crossroads), or what is the relationship between a theme object and a topographic object (a public service hosted in a building)? The formalization of this knowledge will be used as part of a data interlinking approach based on the support of the Large Scale Reference data. Finally, among the applications arising from this integration of linked data with a geographic reference, map viewing allows their development by providing users an easy way to discover them. Some applications of this kind already exist, but are limited to place points on a map background. Using the ontologies that describe the data to propose appropriate cartographic visualization solutions will be studied. We will focus in particular on the use of semantic data to their generalization.