Thèse soutenue

Suivi multi-objets basé sur des tracklets dans un réseau de caméras

FR  |  
EN
Auteur / Autrice : Yosra Dorai
Direction : Frédéric ChausseNajoua Essoukri Ben Amara
Type : Thèse de doctorat
Discipline(s) : Electronique et Systèmes
Date : Soutenance le 25/06/2021
Etablissement(s) : Université Clermont Auvergne (2021-...) en cotutelle avec Université de Sousse (Tunisie)
Ecole(s) doctorale(s) : École doctorale des sciences pour l'ingénieur (Clermont-Ferrand)
Partenaire(s) de recherche : Laboratoire : Institut Pascal (Aubière, Puy-de-Dôme)
Jury : Examinateurs / Examinatrices : Sami Gazzah, Fatma Ezzahra Sayadi, Thierry Chateau
Rapporteurs / Rapporteuses : Abdelmalik Taleb-Ahmed, Chokri Ben Amar

Résumé

FR  |  
EN

Aujourd’hui, les caméras envahissent notre vie, elles sont de plus en plus utilisées dans plusieurs domaines et elles sont installées partout dans des milieux publics et privés, et plus particulièrement dans le contexte de vidéo-surveillance afin d’identifier des personnes ou des véhicules pas seulement par une caméra mais par le réseau entier. L’exploitation des données provenant d’un réseau de caméras devient une nécessité de nos jours pour faire face à des problèmes de sécurité ou même de simple contrôle. Ces systèmes de vision qui peuvent être basés sur des algorithmes d’intelligence artificielle présentent des défis d’actualité. Cette thèse s’inscrit dans le contexte du suivi multi-objets et s’intéresse à la réidentification dans un réseau de caméras. Cette dernière consiste à déterminer la position d’un objet par rapport au champ de vue de chaque caméra. Ce défi devient particulièrement difficile face au changement de l’apparence de l’objet d’une caméra à une autre, la variation de luminosité, l’angle de vue... L’objectif de cette thèse est de proposer une solution fiable afin de réidentifier des objets dans un réseau de caméras assurant une robustesse aux différentes complexités de la réidentification.Dans ce cadre, nous proposons d’exploiter l’historique de l’objet détecté et former un ensemble de noeuds de détection que nous avons appelé « tracklet ». Il s’agit d’une nouvelle approche inspirée des différents travaux de l’état d’art. Nos contributions basées sur des tracklets proposées durant cette thèse touche deux phases : le suivi dans une caméra et la réidentification dans un réseau de caméras. Afin d’optimiser les performances des algorithmes de suivi et de réidentification, il est nécessaire de disposer d’un système de détection fiable. Dans la littérature, les réseaux de neurones convolutifs (CNN) ont eu beaucoup de succès dans la détection multi-objets. Nous avons utilisé une méthode d’apprentissage profond afin de détecter des objets. Bien que cette méthode présente un taux de détection élevé, elle présente aussi un nombre de faux positifs et des faux négatifs surtout lorsque la base de test est différente de la base d’apprentissage. Ce qui nous amené à proposer notre originalité de suivi à base de tracklet qui permet de corriger les défauts de détection et améliorer la qualité de suivi. En fait, notre stratégie se base d’abord sur la construction des tracklets à bases des détections par une comparaison de signature, puis de construire des trajectoires à partir de l’association des tracklets. Cependant, ces trajectoires peuvent présenter des coupures dues à la non-détection. Une étape de mise à jour permet de les combler grâce à un processus d’interpolation qui reconstitue les objets non détectés.Quant à la réidentification, nos contributions se manifestent d’une part dans l’augmentation du volume des données d’apprentissage. En fait, le réseau de neurones qui effectue la réidentification d’une trajectoire dans chaque caméra nécessite, pour son entraînement, un volume important de données. Il se peut que pour certaines caméras ce volume soit trop faible d’où la nécessité de régénérer d’autres données. Notre contribution est de générer des nouveaux échantillons à partir des tracklets détectées dans une autre caméra par un auto-encodeur (GAN). Ce qui nous permet de ne transférer que des vrais positifs d’une façon automatique sans vérification. Au niveau du détecteur dans la ré-identification, les objets sont décrits par parties, ce qui permet de les reconnaître par la suite même s’ils n’apparaissent pas complètement dans une autre caméra. D’autre part, notre contribution se manifeste dans la comparaison des tracklets issues des différentes caméras du réseau. Les améliorations proposées ont été évaluées sur des bases publiques et privées. Les résultats atteints par nos approches montrent des performances comparables à celles des systèmes existants.