Traitement des donnees volumineuses. Mesures et algorithmes d'extraction de regles d'association et regles ordinales

par SYLVIE HELENE GUILLAUME

Thèse de doctorat en Sciences et techniques

Sous la direction de HENRI BRIAND.

Soutenue en 2000

à Nantes .

    mots clés mots clés


  • Résumé

    L'etude proposee concerne les mesures et les algorithmes d'extraction automatiques de regles d'association et de regles ordinales pour des donnees volumineuses. Pour l'extraction de regles d'association, une etude sur les mesures est menee afin d'obtenir des regles interessantes. L'association de trois mesures permet de repondre a cette preoccupation. La premiere, la probabilite conditionnelle, mesure la precision de la regle. La seconde, l'intensite d'implication, evalue le caractere significatif de la regle en nous indiquant si le nombre de contre-exemples observe est significativement faible par rapport a ce que l'on obtiendrait si par hypothese la premisse et la conclusion de la regle etaient independantes. La troisieme, une mesure probabiliste, est proposee et elle mesure la robustesse de la regle c'est-a-dire la proportion de contre-exemples necessaires pour que la regle devienne invalide. Un algorithme d'extraction de regles d'association reposant sur ces trois mesures est propose et teste sur des donnees bancaires. Une comparaison avec les algorithmes apriori et ocd a mis en evidence l'interet de cet algorithme. Une etude particuliere a ete menee pour les variables ordinales afin de prendre en compte leur structure d'ordre. Une mesure statistique est proposee, l'intensite d'implication ordinale, qui evalue pour la regle xy si le nombre des individus possedant de fortes valeurs pour la variable x et de faibles valeurs pour la variable y est significativement faible comparativement a ce que l'on obtiendrait si par hypothese ces deux variables etaient independantes. Cette mesure a conduit a l'extraction d'un nouveau type de regles, les regles ordinales. Un algorithme d'extraction automatique de regles ordinales est propose et valide sur les memes donnees bancaires que pour le premier algorithme. Afin de valider nos resultats, une comparaison avec d'autres techniques a ete menee et a montre l'apport de ce nouveau type d'algorithme.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 203 p.
  • Annexes : 131 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 00 NANT 2109
  • Bibliothèque : Université de Nantes. Service commun de la documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 00 NANT 2109
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.