Approches complémentaires pour une classification efficace des textures

par Vu lam Nguyen

Projet de thèse en STIC - Cergy

Sous la direction de Philippe-Henri Gosselin et de Son Vu.

Thèses en préparation à Cergy-Pontoise , dans le cadre de ED SI - Sciences et Ingénierie , en partenariat avec Equipes Traitement de l'Information et Systèmes (laboratoire) depuis le 29-09-2014 .


  • Résumé

    Cette thèse étudie les approches complémentaires pour classer les images de texture à partir de leur apparence imagée sans imposer de contraintes ou exiger une connaissance a priori des conditions de visualisation ou d'illumination auxquelles les images ont été prises. Les algorithmes de classification basés sur les caractéristiques sont extraits des images de texture pour les classer dans un ensemble d'étiquettes de matériaux pré-apprises. La thèse commence par proposer une variante de modèle binaire local (LBP) pour une classification efficace des textures. Dans cette méthode proposée, une approche statistique de la représentation de la texture statique est développée. Il incorpore l'information de quantité complémentaire d'intensité d'image dans les opérateurs à base de LBP. Nous nommons notre variante LBP `les modèles binaires entropiques locaux terminés (CLEBP) '. CLEBP capture la distribution des relations entre les mesures statistiques du caractère aléatoire des données d'image, calculées sur tous les pixels dans une structure locale. Sans aucun processus de pré-apprentissage et aucun paramètre supplémentaire à apprendre, les descripteurs CLEBP transmettent à la fois des informations globales et locales sur la texture tout en étant robustes aux variations externes. En outre, nous utilisons un filtrage biologiquement inspiré (BF) qui simule les performances de la rétine humaine en tant que technique de prétraitement. Il est montré que notre approche et la LBP conventionnelle ont la force complémentaire et qu'en combinant ces algorithmes, on obtient de meilleurs résultats que l'un ou l'autre considéré séparément. Les résultats expérimentaux de quatre grandes bases de données de texture, y compris Outex, KTH-TIPS-2b, CURet et UIUC, montrent que notre approche est plus efficace que les approches contemporaines. Nous introduisons ensuite un cadre qui est une approche de combinaison de caractéristiques au problème de la classification des textures. Dans ce cadre, nous combinons les caractéristiques de LBP (Local Binary Pattern) avec des contreparties invariantes à faible dimension, rotation et échelle, le réseau de diffusion artisanal (ScatNet). Les résultats expérimentaux montrent que l'approche proposée est capable d'extraire des caractéristiques riches à plusieurs orientations et échelles. Les textures sont modélisées en concaténant l'histogramme des codes LBP et les valeurs moyennes des coefficients ScatNet. Ensuite, nous proposons d'utiliser la technique de prétraitement par Filtrage Inspiré Biologiquement (BF) pour améliorer la robustesse des fonctionnalités LBP. Nous avons démontré expérimentalement que les nouvelles caractéristiques extraites du cadre proposé atteignent des performances supérieures à celles de leurs équivalents traditionnels lorsqu'elles sont comparées sur des bases de données réelles contenant de nombreuses classes présentant des variations d'imagerie significatives. En outre, nous proposons un nouveau réseau artisanal appelé réseau de convolution normalisé. Il est inspiré par le modèle de ScatNet avec deux modifications importantes. Premièrement, la convolution normalisée remplace la convolution standard dans le modèle ScatNet pour extraire des caractéristiques de texture plus riches. Deuxièmement, au lieu d'utiliser les valeurs moyennes des coefficients du réseau, le vecteur de Fisher est exploité comme une méthode d'agrégation. Les expériences montrent que notre réseau propose des résultats de classification compétitifs sur de nombreux benchmarks de texture difficiles. Enfin, tout au long de la thèse, nous avons prouvé par des expériences que les approches proposées obtiennent de bons résultats de classification avec une faible ressource requise. C'est parce que les techniques que nous utilisons sont complémentaires.

  • Titre traduit

    Complementary Approaches for Efficient Texture Classification


  • Résumé

    This thesis investigates the complementary approaches for classifying texture images from their imaged appearance without imposing any constraints on or requiring any prior knowledge of, the viewing or illumination conditions at which the images were taken. Classification algorithms based on features are extracted from texture images to categorize them into a set of pre-learned material labels. The thesis begins by proposing a Local Binary Pattern (LBP) variant for efficient texture classification. In this proposed method, a statistical approach to static texture representation is developed. It incorporates the complementary quantity information of image intensity into the LBP-based operators. We name our LBP variant `the completed local entropy binary patterns (CLEBP)'. CLEBP captures the distribution of the relationships between statistical measures of image data randomness, calculated over all pixels within a local structure. Without any pre-learning process and any additional parameters to be learned, the CLEBP descriptors convey both global and local information about texture while being robust to external variations. Furthermore, we use biologically-inspired filtering (BF) which simulates the performance of human retina as preprocessing technique. It is shown that our approach and the conventional LBP have the complementary strength and that by combining these algorithms, one obtains better results than either of them considered separately. Experimental results on four large texture databases, including Outex, KTH-TIPS-2b, CURet, and UIUC show that our approach is more efficient than contemporary ones. We then introduce a framework which is a feature combination approach to the problem of texture classification. In this framework, we combine Local Binary Pattern (LBP) features with low dimensional, rotation and scale invariant counterparts, the handcrafted scattering network (ScatNet). The experimental results shows that the proposed approach is capable of extracting rich features at multiple orientations and scales. Textures are modeled by concatenating histogram of LBP codes and the mean values of ScatNet coefficients. Then, we propose using Biological Inspired Filtering (BF) preprocessing technique to enhance the robustness of LBP features. We have demonstrated by experiment that the novel features extracted from the proposed framework achieve superior performance as compared to their traditional counterparts when benchmarked on real-world databases containing many classes with significant imaging variations. In addition, we propose a novel handcrafted network called normalized convolution network. It is inspired by the model of ScatNet with two important modification. Firstly, normalized convolution substitute for standard convolution in ScatNet model to extract richer texture features. Secondly, Instead of using mean values of the network coefficients, Fisher vector is exploited as an aggregation method. Experiments show that our proposed network gains competitive classification results on many difficult texture benchmarks. Finally, throughout the thesis, we have proved by experiments that the proposed approaches gain good classification results with low resource required. This is because the techniques we use are supplementary.