Knowledge extraction from uncertain and cyclic time series : application to Manual Wheelchair locomotion analysis

par Vanel Steve Siyou Fotso

Thèse de doctorat en Informatique

Sous la direction de Engelbert Mephu-Nguifo et de Philippe Vaslin.

Le président du jury était Karine Bennis-Zeitouni.

Le jury était composé de Laurence Chèze.

Les rapporteurs étaient Florent Masseglia, Themis Palpanas, Wagner Jr. Meira.

  • Titre traduit

    Extraction de connaissances de séries temporelles incertaines et cycliques : application à la locomotion en fauteuil roulant manuel


  • Résumé

    Cette thèse appréhende des questions scientifiques d'un point de vue de la data science, dans le cadre de l'analyse des séries temporelles issues de la locomotion en fauteuil roulant manuel (FRM). Compression et classification des séries temporelles à l'aide de DTW : l'algorithme Dynamic Time Warping (DTW) est souvent utilisé car il permet d'éviter de petites distorsions entre les séries temporelles au cours de leur alignement. Cependant, DTW produit parfois des alignements pathologiques qui se produisent, lorsque au cours de la comparaison de deux séries temporelles X et Y, un point de données de la série temporelle X est comparé à une grande sous-séquence de Y. Nous démontrons que la compression de séries temporelles à l'aide de l'approximation par morceaux (Piecewise Aggregate Approximation) (PAA) augmente considérablement la qualité de l'alignement avec DTW. Classification non supervisée de séries temporelles basée sur la distance Frobenius : Un shapelet non supervisé (U-shapelet) est une sous-séquence d'une série temporelle utilisée pour segmenter un jeu de données. Notre but est de découvrir des u-shapelets sur des séries temporelles incertaines. Pour ce faire, nous proposons un score de dissimilarité robuste à l'incertitude appelé FOTS dont le calcul est basé sur la décomposition en vecteurs propres et la comparaison des matrices d'autocorrélation de la série temporelle. Ce score est robuste à la présence d'incertitude ; il n'est pas très sensible aux changements transitoires ; il permet de saisir des relations complexes entre des séries temporelles telles que les oscillations et les tendances, et il est également bien adapté à la comparaison de séries temporelles courtes. Le score FOTS a été utilisé avec l'algorithme Scalable Unsupervised Shapelet Discovery pour le clustering de 17 jeux de données, et il a montré une amélioration substantielle de la qualité du clustering par rapport à l'indice Rand. Représentation symbolique de série temporelles cycliques basée sur les propriétés des cycliques : L'analyse des séries temporelles cycliques de la biomécanique est basée sur la comparaison des propriétés de leurs cycles. En général, les algorithmes de fouille de données ignorent cette particularité, nous proposons une représentation symbolique des séries temporelles cycliques basées sur les propriétés de cycles, appelés SAX-P. Les chaînes de caractères résultantes peuvent être comparées en utilisant la distance de distorsion temporelle dynamique (DTW). L'application de SAX-P aux moments propulsifs de trois sujets (S1, S2, S3) se déplaçant en FRM a mis en évidence de caractère asymétrique de leur propulsion. La représentation symbolique SAX-P facilite l'interprétation clinique des résultats de classification.


  • Résumé

    This thesis addresses scientific issues from a data science perspective as part of the analysis of time series from manual wheelchair locomotion (FRM).Compression and classification with Dynamic Time Warping: Dyna- mic Time Warping (DTW) is a time series alignment algorithm that is often used because it considers that it exits small distortions between time series during their alignment. However, DTW sometimes produces pathological alignments that occur when, during the comparison of two time series X and Y, one data point of the time series X is compared to a large subsequence of data points of Y. In this chapter, we demonstrate that compressing time series using Piecewise Aggregate Approximation (PAA) is a simple strategy that greatly increases the quality of the alignment with DTW. This result is particularly true for synthetic data sets.Frobenius correlation based u-shapelets discovery for time series clustering: An unsupervised shapelet (u-shapelet) is a sub-sequence of a time series used for clustering a time series dataset. The purpose of this chapter is to discover u-shapelets on uncertain time series. To achieve this goal, we propose a dissimilarity score robust to uncertainty called FOTS whose computation is based on the eigen- vector decomposition and the comparison of the autocorrelation matrices of the time series. This score is robust to the presence of uncertainty; it is not very sensitive to transient changes; it allows capturing complex relationships between time series such as oscillations and trends, and it is also well adapted to the comparison of short time series. The FOTS score has been used with the Scalable Unsupervised Shapelet Discovery algorithm for the clustering of 17 datasets, and it has shown a substantial improvement in the quality of clustering with respect to the Rand Index. This work defines a novel framework for clustering of uncertain time series.Symbolic representation of cyclic time series based on properties of cycles: The analysis of cyclic time series from bio-mechanics is based on the comparison of the properties of their cycles. As usual algorithms of time series classification ignore this particularity, we propose a symbolic representation of cyclic time series based on the properties of cycles, named SAX-P. The resulting character strings can be compared using the Dynamic Time Warping distance. The application of SAX-P to propulsive moments of three subjects (S1, S2, S3) moving in Manual Wheelchair highlight the asymmetry of their propulsion. The symbolic representation SAX-P facilitates the reading of the cyclic time series and the clinical interpretation of the classification results.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?