Reconnaissance d'objets utilisant des histogrammes multidimensionnels de champs receptifs

par Bernt Schiele

Thèse de doctorat en Sciences appliquées

Sous la direction de JAMES CROWLEY.

Soutenue en 1997

à l'INP GRENOBLE .

    mots clés mots clés


  • Résumé

    Au cours des dernieres annees, l'interet pour des algorithmes de reconnaissance fondes sur l'apparence a considerablement augmente. Ces algorithmes utilisent directement l'informations contenues dans les images pour construire des modeles fondes sur l'apparence : chaque image representee correspond a une apparence particuliere d'un objet. La fiabilite, la vitesse et le taux de reconnaissance eleve de ces techniques en constituent les interets majeurs. Cette these propose une technique ou les objets sont representes par des statistiques sur des operateurs locaux et robustes. Inspire par la reconnaissance rapide d'objets par la methode des histogrammes de couleurs, la premiere partie de la these generalise cette approche en modelisant des objets par des statistiques sur leurs caracteristiques locales. La technique generalisee (appelee histogrammes multidimensionnels de champs receptifs) permet de discriminer un grand nombre d'objets. Les defis des modeles fondes sur l'apparence concernent la reconnaissance en presence d'occultation partielle, la reconnaissance d'objets 3d a partir des images 2d et la classification d'objets comme generalisation en dehors de la base de donnees. La deuxieme partie de la these examine chacun de ces defis et propose une extension appropriee de notre technique. L'interet principal de la these est le developpement d'un modele de representation d'objets qui utilise les statistiques de vecteurs de champs receptifs. On montre qu'une telle representation fondee sur l'apparence est fiable et extremement discriminante pour la reconnaissance d'objets. Plusieurs algorithmes d'identification ainsi que de classification d'objets sont proposes. En particulier, un algorithme probabiliste est defini : il ne depend pas de la correspondance entre les images de test et les objets de la base de donnees. Des experiences obtiennent des taux de reconnaissance eleves en utilisant le modele de representation propose.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 161 P.
  • Annexes : 122 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.