Probabilistic relational models : learning and evaluation : The relational Bayesian networks case

par Mouna Ben Ishak

Thèse de doctorat en Informatique

Sous la direction de Philippe Leray et de Nahla Ben Amor.

Le président du jury était Zied Elouedi.

Le jury était composé de Philippe Leray, Nahla Ben Amor, Zied Elouedi, Céline Rouveirol, Jérôme Darmont, Pierre-Henri Wuillemin.

Les rapporteurs étaient Céline Rouveirol, Jérôme Darmont.

  • Titre traduit

    Les modèles probalistes relationnels : apprentissage et évaluation. Cas des réseaux bayésiens relationnels@


  • Résumé

    L’apprentissage statistique relationnel est apparu au début des années 2000 comme un nouveau domaine de l’apprentissage machine permettant de raisonner d’une manière efficace et robuste directement sur des structures de données relationnelles. Plusieurs méthodes classiques de fouille de données ont été adaptées pour application directe sur des données relationnelles. Les réseaux Bayésiens Relationnels (RBR) présentent une extension des réseaux Bayésiens (RB) dans ce contexte. Pour se servir de ce modèle, il faut tout d’abord le construire : la structure et les paramètres du RBR doivent être définis à la main ou être appris à partir d’une instance de base de données relationnelle. L’apprentissage de la structure reste toujours le problème le plus compliqué puisqu’il se situe dans la classe des problèmes NP-difficiles. Les méthodes d’apprentissage de la structure des RBR existantes sont inspirées des méthodes classique de l’apprentissage de la structure des RB. Pour pouvoir juger la qualité d’un algorithme d’apprentissage de la structure d’un RBR, il faut avoir des données de test et des mesures d’évaluation. Pour les RB les données sont souvent issues de benchmarks existants. Sinon, des processus de génération aléatoire du modèle et des données sont mis en oeuvre. Les deux pratiques sont quasi absentes pour les RBR. De plus, les mesures d’évaluation de la qualité d’un algorithme d ’apprentissage de la structure d’un RBR ne sont pas encore établies. Dans ce travail de thèse, nous proposons deux contributions majeures. I)Une approche de génération de RBR allant de la génération du schéma relationnel, de la structure de dépendance et des tables de probabilités à l’instanciation de ce modèle et la population d’une base de données relationnelle. Nous discutons aussi de l’adaptation des mesures d’évaluation des algorithmes d’apprentissage de RBs dans le contexte relationnel et nous proposons de nouvelles mesures d’évaluation. II) Une approche hybride pour l’apprentissage de la structure des RBR. Cette approche présente une extension de l’algorithme MMHC dans le contexte relationnel. Nous menons une étude expérimentale permettant de comparer ce nouvel algorithme d’apprentissage avec les approches déjà existantes.


  • Résumé

    Statistical relational learning (SRL) appeared in the early 2000s as a new field of machine learning that enables effective and robust reasoning about relational data structures. Several conventional data mining methods have been adapted for direct application to relational data representation. Relational Bayesian Networks (RBNs) extend Bayesian networks (BNs) to a relational data mining context. To use this model, it is first necessary to build it: the structure and parameters of a RBN must be set manually or learned from a relational observational dataset. Learning the structure remains the most complicated issue as it is a NP-hard problem. Existing approaches for RBNs structure learning are inspired from classical methods of learning the structure of BNs. The evaluation of learning approaches requires testing datasets and evaluation measurements. For BNs, datasets are usually sampled from real known networks. Otherwise, processes to randomly generate the model and the data are already established. Both practices are almost absent for RBR. Moreover, metrics to evaluate a RBN structure learning algorithm are not yet proposed. This thesis provides two major contributions. I) A synthetic approach allowing to generate random RBNs from scratch. The proposed method allows to generate RBNs as well as synthetic relational data from a randomly generated relational schema and a random set of probabilistic dependencies. Also, we discuss the adaptation of the evaluation metrics of BNs structure learning algorithms to the relational context and we propose new relational evaluation measurements. II) A hybrid approach for RBNs structure learning. This approach presents an extension of the MMHC algorithm in the relational context. We present an experimental study to compare this new learning algorithm with the state-of-the-art approaches.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (150 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.143-150

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. BU Sciences.
  • Non disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.