Analyse des données en distance de type M1 : théorie et algorithmes d'optimisation

par Baydaa Al Ayoubi

Thèse de doctorat en Mathématiques et informatique appliquées aux sciences sociales

Sous la direction de Georges Le Calvé.

Soutenue en 1991

à Rennes 2 .


  • Résumé

    Notre étude puise ses fondements dans l'analyse des données sous ses deux aspects : analyse factorielle et classification automatique. Dans la pratique de l'analyse des données, l'expérimentateur se trouve en présence de données brutes qui se présentent sous forme d'un tableau croisant individus et variables. L'un des buts de cet expérimentateur est le traitement mathématique qui conduira à proposer une représentation graphique simple offrant une visualisation claire et globale de l'ensemble des données. . . Dans cette perspective, il lui faut introduire une métrique mesurant les dissemblances entre individus. Cependant, l'analyse des données classique se base essentiellement sur la métrique euclidienne. Nous proposons de refaire l'analyse factorielle en adoptant la métrique de Minkowski d'ordre 1 (ou de type M) qui est très intéressante vu le fait que la plupart de nos boulevards et de nos rues sont traces selon le schéma relatif à cette métrique. Nous étudions, les principales caractéristiques d'un espace métrique muni de la norme de Minkowski d'ordre 1, ainsi que l'essentiel des relations qui existent entre cette métrique et les autres types de distances. Apres cette étude théorique, et comme il est courant dans les domaines mathématiques visant à une application pratique des méthodes, nous proposons un algorithme d'optimisation visant à représenter l'ensemble des données par un schéma factoriel dans un espace muni de la norme précédemment mentionnée. Dans le cadre de l'élaboration de nouvelles méthodes et de nouvelles formes de représentations en classification


  • Résumé

    Our study deals with two aspects of the foundation of data analysis : factor analysis and classification theory. In the application of data analysis, the research encounters noise within the data which occur in rectangular arrays. One of the goals of the research is a mathematical procedure which leads to a simple graphical representation offering a clear over view of the data. From this perspective, one must introduce a distance measuring the differences between individuals. However classical data analysis uses the usual Euclidean distance. We intend to approach factor analysis w using the city block metric. We study the main properties of the city block metric as well as its relations to other distances. As it is important and desirable to present applications of an abstract theory, after our theoretical results, we present an optimization algorithm intended to graphically represent the data by a set in RP equipped with the above metric. In the case of the explanateur of new methods and representations within classification theory, we develop a classification algorithm which entails the graphical representation of the individuals from a particular population called an "additive forest", which is a generalization of the notion of "additive tree".

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (196 p.)
  • Notes : Publication autorisée par le jury

Où se trouve cette thèse ?

  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : G.3-AYO
  • Bibliothèque : Université Rennes 2 - BU centrale (Rennes).
  • Disponible pour le PEB
  • Cote : TR Rennes 1991/20
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.