Thèse soutenue

Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab

FR  |  
EN
Auteur / Autrice : Clément Caron
Direction : Bernd AmannCamélia Constantin
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 03/11/2015
Etablissement(s) : Paris 6
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique de Paris 6 / LIP6
Jury : Examinateurs / Examinatrices : Maria-Esther Vidal, Daniela Grigori, Genoveva Vargas-Solar, Christophe Marsala

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La plateforme Weblab est un environnement de définition et d’exécution de chaines de traitements média-mining développé par le service IPCC1 d’Airbus Defence and Space. Il s’agit d’une plateforme ouverte d’intégration de composants externes dont la richesse permet aux concepteurs de construire des chaines média-mining très complexes, mais pose également des problèmes liés à la sensibilité de la qualité des résultats par rapport aux composants utilisés. Avant le début de cette thèse, aucun outil n’existait pour l’analyse et l’amélioration de la qualité de workflows WebLab. La problématique principale de la thèse repose sur le fonctionnement dit boite noire des services WebLab. L’approche choisie est non-intrusive : nous complétons la définition du workflow WebLab par des règles de provenance et de propagation de qualité. Les règles de provenance génèrent des liens de dépendance dit grains-fins entre les données et les services après l’exécution d’une chaine de traitements WebLab. Les règles de propagation de qualité profitent des liens inférés précédemment pour raisonner sur l’influence de la qualité d’une donnée utilisée par un service sur la qualité d’une donnée produite...