Thèse de doctorat en Technologies de l'information et des systèmes
Sous la direction de Patrice Aknin et de Gérard Govaert.
Soutenue en 2010
à Compiègne .
Régression à processus latent pour la modélisation, la classification et le suivi de courbes
Cette thèse s'est focalisée sur l'analyse de courbes à changements de régime. Nous proposons de nouvelles approches probabilistes génératives pour modéliser, classer et suivre temporellement de telles courbes. Le premier volet de la thèse concerne la modélisation et la classification (supervisée ou non) d'un ensemble de courbes indépendantes. Les approches proposées dans ce cadre, qui peuvent être appliquées aussi bien à une courbe qu'à un ensemble de courbes, reposent sur un modèle de régression spécifique incorporant un processus caché s'adaptant aussi bien à des changements de régimes brusques qu'à des changements lents. Le second volet de la thèse concerne la modélisation dynamique d'une séquence de courbes à changements de régime. Nous proposons pour cela des modèles autorégressifs intégrant eux même un processus caché et dont l'apprentissage est réalisé à la fois en mode "hors ligne", quand les courbes sont stockées à l'avance, et en mode "en ligne", quand les courbes arrivent au fur et à mesure au cours du temps. Le volet applicatif de la thèse concerne le diagnostic et le suivi d'état de fonctionnement du mécanisme d'aiguillage des rails qui est un organe impactant considérablement la disponibilité du réseau ferroviaire. Sa surveillance est essentielle pour mieux planifier les actions de maintenance. Les données disponibles pour réaliser cette tâche sont les courbes de puissance électrique acquises lors des manœuvres d'aiguillage, qui ont notamment la particularité de présenter des changements de régime. Les résultats obtenus sur des courbes simulées et des courbes acquises lors de manœuvres d'aiguillage illustrent l'utilité pratique des approches introduites dans cette thèse.
This research addresses the problem of diagnosis and monitoring for predictive maintenance of the railway infrastructure. In particular, the switch mechanism is a vital organ because its operating state directly impacts the overall safety of the railway system and its proper functioning is required for the full availability of the transportation system; monitoring it is a key task within maintenance team actions. To monitor and diagnose the switch mechanism, the main available data are curves of electric power acquired during several switch operations. This study therefore focuses on modeling curve-valued or functional data presenting regime changes. In this thesis we propose new probabilistic generative machine learning methodologies for curve modeling, classification, clustering and tracking. First, the models we propose for a single curve or independent sets of curves are based on specific regression models incorporating a flexible hidden process. They are able to capture non-stationary (dynamic) behavior within the curves and address the problem of missing information regarding the underlying regimes, and the problem of complex shaped classes. We then propose dynamic models for learning from curve sequences to make decision and prediction over time. The developed approaches rely on autoregressive dynamic models governed by hidden processes. The learning of the models is performed in both a batch mode (in which the curves are stored in advance) and an online mode as the learning proceeds (in which the curves are analyzed one at a time). The obtained results on both simulated curves and the real world switch operation curves demonstrate the practical use of the ideas introduced in this thesis.