Thèse de doctorat en Automatique, traitement du signal et des images
Sous la direction de Michel Barlaud.
Soutenue en 2011
à Nice .
L’indexation et la classification automatique d’images font l’objet de cette thèse. Tout d’abord, on décrit le descripteur SMP, qui représente les informations de texture à différents niveaux de résolution. Ensuite, on propose une solution pour optimiser la recherche des k plus proches voisins dans des structures de données adaptées aux divergences de Bregman (synthétisées ou non). La partie centrale de la thèse est consacrée à améliorer les méthodes de classification basées sur prototypes telles que la règle des k-NN dans un cadre inspiré par le boosting. On décrit d’abord la méthode d’apprentissage un contre-tous UNN, ce qui porte le principe de boosting dans la classification basée sur prototypes, en induisant des classifieurs faibles par la minimisation d’une fonctionnelle de risque. Ensuite, on présente l’algorithme multi-classe MLNN, qui repose sur des noyaux d’estimation de densité génériques pour une meilleure précision de classification. Le principal avantage pratique de notre méthode est de réduire considérablement le nombre de prototype qui sont nécessaires au moment de la classification, en rejetant les prototypes les moins fiables, permettant ainsi une meilleure précision à un coût de calcul considérablement réduit. L’approche novatrice présentée a été validée sur des bases d’images de scènes naturelles, qui contiennent de 8 à 15 catégories. Les expériences montrent que la méthode proposée améliore les performances des méthodes de classification basée sur prototypes de manière significative, tout en comparant favorablement avec les meilleures méthodes en termes de coût de calcul. Nous avons aussi appliqué notre méthode au problème de la classification d’images médicales, en particulier pour la tâche de reconnaissance automatique des parties du corps dans les images radiographiques.
In this PhD thesis we address automatic indexing and classification of images. First of all, we describe our original SMP image descriptor, which represents the texture information at different resolution levels sparsely. Then, we address the problem of how to efficiently perform the k-nearestneighbor search with respect to the broad class of Bregman divergences (symmetrised or not). The core part of this thesis is devoted to improve instance-based classification methods like the K-NN rule in a boosting framework. We first describe our UNN one-versus-all learning method, which brings the boosting principle into prototype-based classification, by defining prototypes as weak classifiers to be induced via the minimization of a risk functional. Then, we describe our inherently multiclass MLNN algorithm, that relies on generic density estimation kernels for better classification precision. The main practical advantage of our method is to considerably reduce the size of the prototype set to be used at classification time, by rejecting “noisy” prototypes, thus enabling better precision at a reduced computational cost. We validated our novel approach on some well-known real-world image datasets, which contain from 8 to 15 challenging categories. Experiments show that the proposed method improves over the state-of-the-art prototype-based classification significantly, while comparing favourably with the best performing methods is terms of computational complexity. We also applied our method to the challenging problem of medical image classification, particularly focusing on the body part recognition in radiographic images.