Thèse soutenue

Traitement des donnees volumineuses. Mesures et algorithmes d'extraction de regles d'association et regles ordinales
FR
Accès à la thèse
Auteur / Autrice : SYLVIE HELENE GUILLAUME
Direction : Henri Briand
Type : Thèse de doctorat
Discipline(s) : Sciences et techniques
Date : Soutenance en 2000
Etablissement(s) : Nantes

Résumé

FR

L'etude proposee concerne les mesures et les algorithmes d'extraction automatiques de regles d'association et de regles ordinales pour des donnees volumineuses. Pour l'extraction de regles d'association, une etude sur les mesures est menee afin d'obtenir des regles interessantes. L'association de trois mesures permet de repondre a cette preoccupation. La premiere, la probabilite conditionnelle, mesure la precision de la regle. La seconde, l'intensite d'implication, evalue le caractere significatif de la regle en nous indiquant si le nombre de contre-exemples observe est significativement faible par rapport a ce que l'on obtiendrait si par hypothese la premisse et la conclusion de la regle etaient independantes. La troisieme, une mesure probabiliste, est proposee et elle mesure la robustesse de la regle c'est-a-dire la proportion de contre-exemples necessaires pour que la regle devienne invalide. Un algorithme d'extraction de regles d'association reposant sur ces trois mesures est propose et teste sur des donnees bancaires. Une comparaison avec les algorithmes apriori et ocd a mis en evidence l'interet de cet algorithme. Une etude particuliere a ete menee pour les variables ordinales afin de prendre en compte leur structure d'ordre. Une mesure statistique est proposee, l'intensite d'implication ordinale, qui evalue pour la regle xy si le nombre des individus possedant de fortes valeurs pour la variable x et de faibles valeurs pour la variable y est significativement faible comparativement a ce que l'on obtiendrait si par hypothese ces deux variables etaient independantes. Cette mesure a conduit a l'extraction d'un nouveau type de regles, les regles ordinales. Un algorithme d'extraction automatique de regles ordinales est propose et valide sur les memes donnees bancaires que pour le premier algorithme. Afin de valider nos resultats, une comparaison avec d'autres techniques a ete menee et a montre l'apport de ce nouveau type d'algorithme.