Analytique des données massives basée sur des ontologies: application à la plateforme de formation SIDES 3.0 en médecine

par Adam Sanchez Ayte

Projet de thèse en Mathématiques et Informatique

Sous la direction de Marie-Christine Rousset et de Fabrice Jouanot.

Thèses en préparation à Grenoble Alpes , dans le cadre de École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble) , en partenariat avec Laboratoire d'Informatique de Grenoble (laboratoire) depuis le 06-05-2019 .


  • Résumé

    À la croisée de l'intelligence artificielle et des bases de données, l'accès aux données ontologiques (OBDA) suscite un intérêt croissant car il permet aux utilisateurs finaux de poser leurs propres requêtes (éventuellement complexes) en utilisant un vocabulaire de domaine qu'ils connaissent bien. . Les systèmes OBDA ont une architecture à trois niveaux, constituée d'une ontologie, de sources de données et de mappages entre les deux. Dans l'approche standard OBDA (appelée approche virtuelle), les mappages sont exploités pour reformuler les requêtes des utilisateurs en requêtes efficaces évaluées sur les sources de données. Cependant, les approches de réécriture à la pointe de la technologie ne permettent pas de traiter des requêtes complexes agrégées et de comptage, qui sont pourtant au cœur de l'analyse de données. L'objectif du travail de doctorat est de concevoir et de mettre en œuvre une infrastructure OBDA pour prendre en charge le stockage, l'enrichissement sémantique et l'analyse à la demande de grandes quantités de données éducatives produites par SIDES, la plate-forme de cyberapprentissage médical française pour le classement et la formation académiques.

  • Titre traduit

    Large-scale ontology-based data analytics: application to the SIDES 3.0 training platform in Medicine


  • Résumé

    Ontology-based Data Access (OBDA) is a novel paradigm at the crossroad of Artificial Intelligence and Databases that has recently received an increasing interest because it enables end-users to ask their own (possibly complex) queries using a domain vocabulary they are familiar with. OBDA systems have a three-level architecture, constituted by an ontology, data sources, and mappings between the two. In the standard OBDA approach (called the virtual approach), the mappings are exploited to reformulate users queries into effective queries evaluated over the data sources. However, the state-of-the art rewriting approaches are unable to deal with complex aggregated and counting queries, which are yet at the core of data analytics. The goal of the PhD work is to design and implement an OBDA infrastructure to support the storage, semantic enrichment and on-demand analytics of large amounts of educational data produced by SIDES, the french national medical e-learning platform for academic ranking and training.