Thèse soutenue

Architectures connexionnistes multi-modulaires. Application a l'analyse de scenes

FR  |  
EN
Auteur / Autrice : Emmanuel Viennet
Direction : Françoise Fogelman-Soulié
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1993
Etablissement(s) : Paris 11

Résumé

FR

Cette these est consacree a l'etude d'approches connexionnistes pour l'analyse de scene, c'est-a-dire la localisation puis l'identification d'objets dans des images. Pour cette tache, il est essentiel de disposer de systemes de classification precis, rapides et dotes de capacite d'apprentissage. Les reseaux connexionnistes, systemes adaptatifs reposant sur des traitements numeriques massivement parallelisables, sont par consequent d'excellents candidats. La premiere partie de la these decrit les modeles connexionnistes les plus interessants pour le traitement et la classification d'images. Nous indiquons les liens etroits unissants ces modeles aux approches statistiques usuelles. La construction d'une architecture connexionniste a partir de modules algorithmiques simples facilite le traitement de taches complexes. La decomposition en modules distincts permet en effet d'introduire des connaissances a priori sur la solution, de mieux controler l'apprentissage, et debouche sur des systemes plus efficaces. Nous proposons plusieurs nouvelles architectures multi-modulaires pour la classification. Dans une deuxieme partie, nous etudions le probleme de la reconnaissance et de la segmentation de chiffres manuscrits. Des etudes experimentales detaillees montrent l'apport des systemes modulaires, qui permettent une tres nette acceleration des calculs a performances comparables. Ces resultats nous suggerent une deuxieme application, la localisation et l'identification de visages dans des images de scenes naturelles, pour laquelle peu de solutions performantes ont ete proposees. Nous utilisons une analyse multiresolution et un classifieur constitue de deux reseaux en cascade. Les visages detectes sont identifies par un troisieme reseau, qui permet de distinguer les personnes connues des visages inconnus. Les performances obtenues autorisent des applications reelles