Formalisme statistique pour ensembles de structures discrètes

par Sébastien Rebecchi

Thèse de doctorat en Informatique

Sous la direction de Jean-Michel Jolion.


  • Résumé

    En reconnaissance de formes, le codage de l'information extraite des données est une étape décisive, et l'utilisation de structures semble être le choix le plus pertinent. Cependant, le codage sous forme de vecteurs de caractéristiques numériques offre l'avantage de permettre l'utilisation de nombreux algorithmes efficaces développés spécifiquement pour la classification de vecteurs numériques dans des disciplines connexes à la reconnaissance de formes. De ce constat est né un champs de recherche dédié à la caractérisation statistique des espaces de structures. Parallèlement, ont vu le jour un ensemble des travaux basés sur une transformation des structures sous forme de vecteurs numériques. Enfin, les probabilités sont un paradigme largement utilisé pour la classification de données structurées, via la modélisation de distribution de structures et l'utilisation massive du classifieur par maximisation de vraisemblance. Dans cette thèse, nous proposons la traduction aux espaces structurels de critères permettant de définir les notions statistiques d'uniformité et de normalité de lois de probabilités. Nous proposons également une réflexion sur la définition de variables aléatoires de structures à valeur dans un espace vectoriel, avec pour perspective la possibilité d'application, dans le domaine structurel, du théorème central limite, résultat d'importance fondamentale en théorie des probabilités et statistique. D'un point de vue applicatif, nous évaluons les apports d'une partie de nos travaux pour la résolution de problèmes typiques en reconnaissance de formes, à savoir la classification de séquences d'ADN et la classification d'images de chiffres dessinés à la main.

  • Titre traduit

    = Statistical formalism for sets of discrete structures


  • Résumé

    In pattern recognition, the coding of information extracted from the data is a decisive phase, and the use of structures seems to be the most pertinent choice. However, the coding in the form of numeric feature vectors offers the advantage of enabling, in the sequel, the use of numerous efficient algorithms specifically developed for the classification of numeric vectors in fields connected to pattern recognition. From this observation was born a research field devoted to the statistical characterization of structure spaces. At the same time have been developed a set of works based on a transformation of structures into numeric vectors. Finally, probabilities are a widely used paradigm for the classification of structured data, via the modelling of distributions of structures and a massive use of the maximum likelihood classifier. In this thesis, we propose the translation to structure spaces of criteria enabling to define the statistical notions of uniformity and normality of probability laws. We propose as well a reflection on the definition of structural random variables taking their values in a vector space, having in prospect the possibility of applying, in the structural domain, the central limit theorem, a fundamentally important result in probability theory and statistics. From an applicative point of view, we evaluate the contribution of a part of our work for the resolution of typical problems in pattern recognition, namely the classification of DNA sequences and the classification of images of handwritten digits.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (134 p.)
  • Annexes : Bibliogr. p. 131-134

Où se trouve cette thèse ?

  • Bibliothèque : Institut national des sciences appliquées (Villeurbanne, Rhône). Service Commun de la Documentation Doc'INSA.
  • Disponible pour le PEB
  • Cote : C.83(3626)
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.