Thèse soutenue

Les bases de données graphes pour la science des données : implantation d'entrepôts des données et prédiction d'interactions protéine-protéine

FR  |  
EN
Auteur / Autrice : Hajer Akid
Direction : Nicolas LachicheMounir Ben Ayed
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 12/12/2022
Etablissement(s) : Strasbourg en cotutelle avec Université de Sfax (Tunisie)
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences de l'information et de l'ingénieur (Strasbourg ; 1997-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie (Strasbourg ; 2013-....)
Jury : Président / Présidente : Mohamed Jmaiel
Examinateurs / Examinatrices : Omar Boussaid
Rapporteurs / Rapporteuses : Malika Smaïl-Tabbone, Jamel Feki

Résumé

FR  |  
EN

Avec l’essor du big data, le recours à la science des données est devenu crucial pour extraire les connaissances à partir des données massives. Ces dernières années, plusieurs catégories de bases de données ont été utilisées en science des données pour stocker, gérer et analyser efficacement les mégadonnées. En particulier, les bases de données NoSQL (Not Only SQL) ont émergé comme une alternative aux bases de données relationnelles. Dans cette thèse, nous nous intéressons à la catégorie orientée graphes des bases de données NoSQL qui remplace les jointures relationnelles coûteuses par des parcours du graphe. Nous les utilisons pour répondre à deux problématiques en science des données et qui constituent nos principales contributions : implanter des entrepôts de données capables de répondre rapidement à des requêtes analytiques complexes et construire des descripteurs afin de les utiliser pour prédire les valeurs manquantes sur les arcs d’un réseau d’interaction protéine-protéine.