Qualité du web de données

par Subhi Issa

Projet de thèse en Informatique

Sous la direction de Samira Si said cherfi et de Fayçal Hamdi.

Thèses en préparation à Paris, CNAM , dans le cadre de Ecole Doctorale d'Informatique, Télécommunications et Electronique (EDITE) , en partenariat avec Centre d'études et de recherche en informatique et communications (Paris) (laboratoire) et de ISID - Ingénierie des Systèmes d'Information et de Décision (equipe de recherche) depuis le 01-10-2015 .


  • Résumé

    La recherche de la qualité de l'information a été appliquée avec succès dans le contexte des bases de données relationnelles en ayant un effet positif sur les processus organisationnels qui les utilisent. Se pose donc la question de l'applicabilité de cette approche de la qualité dans le contexte du Web de données. L'évaluation de la qualité nécessite l'identification des dimensions de qualité qui serviront de base à l'évaluation. Ceci nécessite l'élaboration de méthodes et d'outils adéquats permettant la mesure de la qualité. Ces méthodes devront tenir compte du processus de traitement de la donnée dans son intégralité de la production (publication, intégration, etc.) à la livraison (requêtage, développement de mashups). Le but de cette thèse est de proposer une approche complète comprenant une méthode et des outils pour assurer la qualité du web de données. On propose un modèle de la qualité adapté au contexte du web de données, une méthode d'évaluation objective, une méthode d'amélioration de la qualité, un ensemble d'outils permettant d'une part de démontrer la faisabilité de la solution proposée et d'autre part son implémentation via des outils qui faciliteront son application.

  • Titre traduit

    Web Data Quality


  • Résumé

    Research on information quality has been extensively and successfully applied in traditional relational database systems. This led to the development of approaches and tools that had a positive impact on organizations. The emergence of Linked Open Data (LOD) raises the question of the applicability of these solutions in this new context. Quality assurance requires the identification of suitable data dimensions. These dimensions will serve as a basis for assessment leading to the development of methods and tools to support the evaluation process. In the context of LOD, the quality should be considered during the whole process, from production (publishing, integration, etc.) to delivery (querying, mashup development, etc.). The purpose of this thesis is to propose a comprehensive approach, including models, methods, measures and tools to ensure the quality of data published according to the LOD principles. New models will be adapted from traditional solutions to cope with LOD specific needs and constraints. A set of tools will be developed to implement and test the proposed solutions.