Thèse soutenue

Représentations compactes et apprentissage non supervisé de variétés non linéaires : Application au traitement d’images

FR  |  
EN
Auteur / Autrice : Matthieu Brucher
Direction : Fabrice HeitzJean-Paul Armspach
Type : Thèse de doctorat
Discipline(s) : Électronique, électrotechnique et automatique
Date : Soutenance en 2008
Etablissement(s) : Université Louis Pasteur (Strasbourg) (1971-2008)

Mots clés

FR

Mots clés contrôlés

Résumé

FR

Cette thèse et ses contributions ont proposé une modélisation innovante de données et son utilisation en vue de classifications. La modélisation comprend une réduction de dimension robuste, permettant de faire face au bruit et respectant la structure des données dans un espace de dimension réduite. Cette méthode a été comparée aux méthodes usuelles de la littérature à l’aide de plusieurs jeux de données (SwissRoll, SCurve, base COIL-20). Par la suite, une méthode de régression linéaire par morceaux a été exposée, permettant de créer un lien entre l’espace de dimension réduite et l’espace d’origine. Contrairement aux méthodes présentées dans la littérature, l’approche choisie adapte le nombre de modèles linéaires nécessaires à la précision de modélisation recherchée. Grâce à cette modélisation, une projection robuste de nouveaux échantillons sur la variété a été possible. Cette méthode a permis d’obtenir des résultats d’aussi bonne qualité ou de meilleure qualité que les approches robustes basées sur l’analyse en composantes principales qui est la méthode couramment utilisée pour l’apprentissage de variété. Une méthode originale de classification supervisée a été proposée, en modélisant chaque classe comme une variété puis en projetant chaque nouvel échantillon sur chacune des variétés et en sélectionnant le meilleur projeté (au sens d’un certain critère). Des applications pratiques ont été entreprises sur des données de texture ou sur des formes synthétiques. Ces applications ont confirmé les performances de l’approche proposée. En effet, la classification sur les textures est meilleure que les approches proposées dans la littérature et les tests sur les formes ont permis de détecter des différences localisées sur des formes anormales. Plusieurs bibliothèques de traitement ont été développées et améliorées dans le cadre de cette thèse. Elles ont été programmées en C++ ou en Python, en utilisant les avantages de chaque langage (la vitesse ou l’utilisation des gabarits du C++ pour les calculs ; la souplesse ou l’encapsulation de Python pour la création des prototypes ou la création d’une bibliothèque d’optimisation). Enfin, ces bibliothèques ont été mises à disposition dans le logiciel interne Medimax et son successeur MediPy. [. . . ]