Extension des méthodes d'analyse factorielle à des données de type intervalle

par Ahlame Douzal-Chouakria

Thèse de doctorat en Sciences appliquées

Sous la direction de Pierre Cazes et de Edwin Diday.

Soutenue en 1998

à Paris 9 .


  • Résumé

    L’analyse factorielle permet d’extraire, à partir de données nombreuses, les tendances les plus marquantes. A l’aide de représentations graphiques, elle visualise des groupements, des oppositions, des tendances, impossibles à discerner directement sur un tableau de données. L’objectif de ce travail est d’étendre, deux méthodes en analyse factorielle, l’analyse en composantes principales et l’analyse des correspondances multiples, à des données de type intervalle. Dans la première partie de ce travail, on présente une extension de l’analyse en composantes principales à des données de type intervalle, mu nies éventuellement de contraintes de domaines. On propose deux nouvelles approches : la méthode des sommets et la méthode des centres. L’inertie prise en compte par chacune de ces méthodes est analysée puis comparée. Les paramètres d’aide à l’interprétation sont généralisés aux données intervalles. La visualisation ponctuelle des individus, dans les plans factoriels, se traduit ici par une visualisation de rectangles, segments ou points. On propose une procédure itérative qui fournit une visualisation des objets à différents niveaux de qualité de représentation. D’une part, on confronte dans un cadre probabiliste la méthode des sommets et la méthode des centres. D’autre part, on établit un rapprochement entre la méthode des sommets, la méthode Statis et l’analyse factorielle discriminante. Dans une deuxième partie, on s’intéresse à l’extension de l’analyse des correspondances multiples à des données intervalles. On propose trois techniques de codage de variables de type intervalle : le codage croisé, le codage par sommets et le codage sans décomposition. Les deux premières techniques se basent sur la décomposition des variables intervalles en variables numériques. La dernière technique se base sur l’extension d’outils de codage des variables numériques (fonction de répartition, histogramme, fonction d’appartenance, etc. ) à des données intervalles

  • Titre traduit

    Extension of factorial analysis methods to interval data


  • Pas de résumé disponible.


  • Résumé

    Factorial analysis aims to extract and to visualize the main trends of a data set. The aim of this work is to extend principal component and correspondence analysis to interval data. In the first part of this work we present an extension of principal component analysis to interval data, with or without field constraints. We propose two novel methods called the vertices method and the centers method corresponding, respectively, to the within/between analysis and the between analysis. These methods are first compared in a probabilistic case, then a link is made between the vertices method, the Statis method and the discriminant factorial analysis. In the second part of this work, we extend the multiple correspondence method to interval data. To do so, we propose three new fuzzy coding techniques for interval variables: cross-coding, vertices coding and coding without decomposition. The first two are based on the decomposition of interval variables into numerical ones. The third technique is based on the extension of classical coding tools (histogram, probabilistic distribution function, membership function, etc. ) to interval distribution.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (197 p.)
  • Annexes : 63 réf

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : G-CHO
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.