Thèse de doctorat en Mathématique. Statistique
Sous la direction de Ludovic Lebart.
Soutenue en 1993
à Paris 6 .
Nous exposons une nouvelle representation graphique de tres grands ensembles de donnees documentaires (et textuelles, apres normalisation), ainsi que deux algorithmes pour l'extraire automatiquement des donnees. Nous presentons en premier lieu des arguments en faveur de cette representation par poles et zones d'influences floues et recouvrantes: elle permet d'abord de realiser une interface de navigation dans les bases documentaires, c'est-a-dire un hypertexte avec generation automatique des liens (constitue d'une carte globale des themes presents dans les donnees, et d'axes locaux de defilement pour les documents et termes caracteristiques de chaque theme). Cette approche peut aussi servir de base a des analyses scientometriques et bibliometriques, et ouvre des perspectives sur les processus cognitifs de categorisation. Nous presentons ensuite notre algorithme des k-means axiales, derive de l'algorithme de classification automatique k-means, puis notre algorithme d'analyse en composantes locales, consistant a reperer l'ensemble des optimas d'une fonction locale de densite. Ces algorithmes de suivi de gradient peuvent s'interpreter comme des lois d'apprentissage de reseaux neuronaux. Des ponts sont etablis avec l'analyse des correspondances. Un exemple de traitement d'une base documentaire reelle est detaille, ainsi qu'une maquette d'interface utilisateur sous hypercard. Enfin nous passons en revue un ensemble de methodes voisines dans les domaines de l'analyse des donnees et des reseaux neuronaux, que ce soit du point de vue de la representation obtenue, du processus d'optimisation utilise, ou de la prise en compte de la notion de localite
Neural models for documentary and textual data analysis
Pas de résumé disponible.