Évaluation de la qualité des données géographiques d'OpenStreetMap:cas de la République de Djibouti

par Ibrahim Maidneh Abdi

Projet de thèse en Sciences et Technologies de l'Information Géographique

Sous la direction de Ana-Maria Olteanu raimond.

Thèses en préparation à Paris Est , dans le cadre de MSTIC : Mathématiques et Sciences et Technologies de l'Information et de la Communication , en partenariat avec LaSTIG -Laboratoire en Sciences et Technologies de l'Information Géographique (laboratoire) depuis le 01-03-2018 .


  • Résumé

    Dans un pays tel que la République de Djibouti, où il n'existe pas un organisme national qui régie des normes et des spécifications sur les conditions de production de la Donnée Géographique et de son utilisation, la question de la qualité de données géographiques existantes ainsi que la fiabilité des analyses spatiales qui en découlent, demeure méconnue voire inexistante. Plus précisément, il n'existe pas un référentiel national géographique constituerait une base de données géographiques nationale qui servirait de référence pour évaluer la qualité des données géographiques produites par un tiers service ou acteur national. Dans ce contexte d'absence des données de référence, depuis 2007, une communauté de chercheurs s'intéressent à la qualité de données faites par des volontaires à travers des applications de géolocalisation disponibles sur le Web. Ce concept est connu sous le nom du "Volunteered Geographic Information" (VGI).C'est le cas des données d'OpenStreetMap(OSM), une cartographie en ligne et open source sur une base de données géographiques vectorielles. Ceci trouve son importance du fait que la donnée VGI constituerait une très bonne source pour créer des données de référence vu sa richesse, sa disponibilité et son universalité. Cela pourrait servir de base vers un processus de mise en place des référentiels nationaux. Ainsi les chercheurs proposent d'évaluer la qualité à travers des indicateurs qui évaluent non pas la donnée géographique, mais plutôt la source de la donnée, c'est-à-dire le contributeur. Ces indicateurs sous la base de trois approches(le "crowdsourcing", "approche sociale" et "approche tirée sur les lois de la géographie") tentent de crédibiliser les contributeurs des données géographiques pour en tirer indirectement des cotes de qualité sur la donnée contribuée. Ces approches connaissent quelques limitations. C'est pourquoi nous optons une approche de Datamining qui ne tiendrait compte que les données géographiques indépendamment des contributeurs ,d'ou la perspective de mettre en place un modèle mathématique qui pourrait évaluer de manière automatique la qualité des données VGI en s'appuyant des méthodes de Datamining. Une fois le modèle défini théoriquement puis développé de manière informatique, il sera testé sur des données OSM évalué auparavant à l'aide d'une base de données de référence. L'idée consiste a validé le modèle en l'appliquant à des données OSM dont on a déjà qualifié de "bonne qualité" par exemple les données OSM français. Si donc ce modèle confirme la même qualité, ce dernier sera validé et donc son application serait universelle. Par la suite on procédera à l'application du modèle aux données OSM de Djibouti afin de se prononcer sur leur qualité. Une fois les données OSM Djiboutiens testées, nous examinerons les conditions et les spécifications dans lesquelles ces données testées pourraient être prise comme une base de données de référence. Notre travail devrait aboutir à ce référentiel qui sera la base de tout autre travail sur la qualité de données vectorielles. Les travaux futures pourront essayer d'élargir cette base de données de façon à étendre l'évaluation de la qualité sur d'autres types de données géographiques (matricielles, thématiques, MNT..etc.) afin d'enrichir le référentiel national.

  • Titre traduit

    Assessing the quality of spatial data OpenStreetMap: Case of the Republic of Djibouti


  • Résumé

    In a country such as the Republic of Djibouti, where there is no national body that regulates standards and specifications on the conditions of production of the Geographical Data and its use, the question of the quality of existing geographical data as well as that the reliability of the spatial analyzes that result from it remains unknown or even non-existent. More precisely, there is no national geographic reference system which would constitute a national geographic database and which would serve as a reference for assessing the quality of the geographical data produced by a third party service or national actor.    In this context of lack of baseline data, since 2007, a community of researchers are interested in the quality of data made by volunteers through geolocation applications available on the Web. This concept is known as "Volunteered Geographic Information" (VGI). This is the case of OpenStreetMap (OSM) data, an online and open source cartography on a vectorial geographic database.    This is important because the VGI data would be a very good source for creating baseline data given its richness, availability and universality. This could serve as a basis for a process of setting up national standards.    Thus researchers propose to evaluate the quality through indicators that evaluate not the geographical data, but rather the source of the data, that is to say the contributor. These indicators under the base of three approaches (the "crowdsourcing", "social approach" and "approach based on the laws of geography") try to give credibility to the contributors of geographical data to indirectly draw quality ratings on the data contributed. .    These approaches have some limitations. This is why we take a Datamining approach that only considers geographic data independently of the contributors, hence the prospect of setting up a mathematical model that could automatically evaluate the quality of the VGI data by relying on data. Datamining methods.    Once the model is theoretically defined and then developed in a computerized manner, it will be tested on previously evaluated OSM data using a reference database. The idea is to validate the model by applying it to OSM data that has already been described as "good quality" for example French OSM data. If this model confirms the same quality, it will be validated and therefore its application would be universal.    Subsequently, the model will be applied to the OSM data of Djibouti to decide on their quality.    Once the Djiboutian OSM data has been tested, we will examine the conditions and specifications in which these tested data could be taken as a reference database.    Our work should lead to this repository which will be the basis of any other work on the quality of vector data.     Future work may attempt to expand this database to extend the quality assessment to other types of geographic data (raster, thematic, DTM, etc.) to enrich the national frame of reference.