l'extraction de motifs graduels à partir de bases de données NoSQL en graphes.

par Faaiz hussain Shah

Projet de thèse en Informatique

Sous la direction de Anne Laurent.

Thèses en préparation à Montpellier , dans le cadre de École Doctorale Information, Structures, Systèmes (Montpellier ; 2015) , en partenariat avec Laboratoire d'Informatique, Robotique et Micro-électronique de Montpellier (laboratoire) et de Département Informatique (equipe de recherche) depuis le 01-02-2017 .


  • Résumé

    E sujet de thèse de M. Faaiz Hussain Shah est lié à l'extraction de motifs graduels à partir de bases de données NoSQL en graphes. Le travail fera suite aux travaux déjà effectués au sein du groupe de recherche ODRG sur la gestion, la fouille et le résumé de telles données. Les données cibles sont modélisées au sein de graphes de propriété qui ont la particularité de porter des propriétés (sous la forme de couples (clé:valeur)) à la fois sur les noeuds et sur les relations entre ces noeuds. Dans le cadre des bases de données NoSQL, elles sont très utilisées pour faire face aux données complexes et volumineuses dans de nombreux contextes d'application (biologie, réseaux sociaux, etc). Dans les travaux précédents (A. Castelltort et A. Laurent), des premiers modèles de résumés de ces bases de données ont été proposés. La thèse vise à étendre ces protoformes pour une prise en compte plus complète des graphes de propriété d'une part et la volumétrie des données d'autre part. Le programme scientifique intègre donc tout d'abord l'étude de l'état de l'art à la fois des résumés de données et des graphes de propriété (NoSQL, bases In-Memory). Il s'agira ensuite de proposer des modèles de transformation des données pour supporter les protoformes de résumés de données d'une part et d'autre part d'étendre les méthodes d'extraction de résumés pour prendre en compte les données complexes des graphes de propriété. Pour ces deux types de contribution, l'imprécision devra être prise en compte et des évaluations devront être réalisées sur des données synthétiques et réelles en lien avec le Web Sémantique et les données ouvertes liées (Linked Open Data) dans le cadre du groupe de recherche ODRG.

  • Titre traduit

    l'extraction de motifs graduels à partir de bases de données NoSQL en graphes.


  • Résumé

    .