Méthodes prédictives par extraction de règles en présence de données symboliques

par Filipe Afonso

Thèse de doctorat en Informatique

Sous la direction de Edwin Diday.

Soutenue en 2005

à l'Université Paris-Dauphine .


  • Résumé

    Nous commençons par étendre la régression linéaire aux cas des variables symboliques intervalles, diagrammes, histogrammes, taxonomiques et hiérarchiques. Dans un deuxième temps, les travaux étendent les règles d'association aux cas des données symboliques diagrammes, intervalles, hiérarchiques et taxonomiques. La méthode proposée nous permet de découvrir des règles d'association au niveau des concepts. Notamment, plutôt que d'extraire des règles d'association entre différents articles du panier de la ménagère comme dans le cas classique, nous extrayons des règles d'association au niveau des clients afin d'étudier leurs comportements d'achat. L'algorithme Apriori d'extraction des règles d'association est étendu à ses données symboliques. La régression linéaire symbolique est, alors, utilisée pour étudier la qualité des règles d'association symboliques découvertes et pour les sélectionner. Nous proposons, ensuite, un support mathématique pour les règles d'association découvertes à l'aide de la théorie des treillis de Galois.

  • Titre traduit

    Predictive methods using extraction of rules in presence of symbolic data


  • Résumé

    We first extend linear regression methods to the case of interval, diagram, histogram, taxonomical and hierarchical variables. Second, association rules are extended to the case of interval, diagram, taxonomical and hierarchical variables. We will be able to discover rules at the level of the concepts thanks to these methods. For example, instead of mining rules between different items of some transactions recorded in a retail organization like in the classical case, we discover rules at the level of the customers in order to study their purchase behavior. The Apriori algorithm for the extraction of association rules is extended to these symbolic data. The symbolic linear regression is, then, used in order to study and select the symbolic association rules. Afterwards, we give a mathematical support to these association rules using Galois lattices theory.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 239 p.
  • Notes : Publication autorisée par le jury
  • Annexes : bibliogr.145 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Consultable sur place dans l'établissement demandeur
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.