Piecewise models for long memory time series

par Li Song

Thèse de doctorat en Physique. Automatique et traitement du signal et des images

Sous la direction de Pascal Bondon.

Soutenue en 2010

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .

  • Titre traduit

    = Modèles par blocs pour des séries chronologiques à longue mémoire


  • Résumé

    De nombreux travaux existent sur les processus stationnaires à longue mémoire (LM) et sur les modèles présentant des changements structurels. Cependant, il y a relativement peu de travaux sur les processus à LM non stationnaires faisant intervenir des ruptures, et ceci sans doute car LM et changement structurel sont deux phénomènes qu'il est facile de confondre. Dans cette thèse, nous considérons un modèle paramétrique de séries chronologiques à LM et non stationnaires : le processus localement autorégressif à moyenne mobile fractionnairement intégrée (FARlMA). Dans ce modèle, le nombre et les positions des points de ruptures (PRs) peuvent varier entre deux régimes, de même que les ordres et les coefficients des différentes parties FARlMA. Nous proposons deux méthodes pour estimer les paramètres de ce modèle. La première consiste à optimiser un critère basé sur le principe de description de longueur minimum (MDL). Nous montrons que ce critère est meilleur que le critère d'information bayésien et qu'un critère existant dans la littérature et aussi basé sur le principe MOL. Comme l'espace paramétrique est de grande dimension, l'optimisation pratique de notre critère est une tâche difficile et nous proposons une mise en oeuvre basée sur un algorithme génétique. La seconde méthode s'applique au cas de séries très longues comme des données de trafic intemet par exemple. En effet dans ce cas, la minimisation d'un critère basé sur le principe MDL est quasi impossible en pratique. Pour ajuster le modèle, nous proposons une méthode basée sur les différences entre les estimations des paramètres des différents blocs de données. La méthode se décompose en quatre étapes. Dans l'étape 1, nous ajustons un modèle FARlMA stationnaire à la série complète. Des estimées locales des paramètres sont obtenues dans l'étape 2. Dans l'étape 3, pour tous les nombres possibles de PR, on sélectionne les intervalles contenant un PR, on estime les positions des PRs et on estime les paramètres de chaque bloc. Enfin, l'étape 4 concerne la sélection du nombre de PRs en utilisant la somme des carrés des résidus des différents blocs. On montre l'efficacité de nos deux méthodes d'estimation au moyen de simulations numériques et on étudie aussi le cas de séries réelles.


  • Résumé

    There are many studies on stationary processes exhibiting long range dependence (LRD) and on piecewise models involving structural changes. But the literature on structural breaks in LRD models is relatively sparse because structural changes and LRD are easily confused. Some works consider the case where only some coefficients in a LRD model are allowed to change. Ln this thesis, we consider a non-stationary LRD parametric model, namely the piecewise fractional autoregressive integrated moving-average (FARlMA) model. It is a pure structural change model inwhich the nurnber and the locations of break points (BPs) as well as the ARMA orders and the corresponding coefficients are allowed to change between two regimes. Two methods are proposed to estimate the parameters of this model. The first one is to optimize a criterion based on the minimum description length (MDL) principle. We show that this criterion outperforms the Bayesian information criterion and another MDL based criterion proposed in the literature. Since the search space is huge, the practical optimization of our criterion is a complicated task and we design an automatic methodology based on a genetic algorithm. The second method is designed for very long time series, like Internet traffic data. Ln such cases, the minimisation of the criterion based on MDL is very difficult. We propose a method based on the differences between parameter estimations of different blocks of data to fit the piecewise FARIMA model. This method consists in a four-step procedure. Ln Step 1, we fit a stationary FARiMA model to the whole series. Local parameter estimates are obtained in Step 2. Ln Step 3, for all possible BP numbers, we select the intervals with a BP, we estimate the BP locations and we estimate the parameters of each stationary block. Lastly, Step 4 concerns the selection of the BP number using the sum of squared residuals of the different fitted piecewise models. The effectiveness of the two methods proposed in the thesis is shown by simulations and applications to real data are considered.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (pagination multiple 136- [44] p.)
  • Annexes : Notes bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2010)128
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.