Comportement d'estimateurs non paramétriques des statistiques du second ordre de séries temporelles de grande dimension via les grandes matrices aléatoires.

par Alexis Rosuel

Projet de thèse en Signal, Image, Automatique

Sous la direction de Philippe Loubaton et de Cristina Butucea.

Thèses en préparation à Paris Est , dans le cadre de École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication (Champs-sur-Marne, Seine-et-Marne ; 2015-....) , en partenariat avec Laboratoire d'informatique de l'Institut Gaspard Monge (laboratoire) et de Signal, Communications (equipe de recherche) depuis le 01-11-2018 .


  • Résumé

    Les grandes matrices aléatoires se sont révélées depuis quelques temps être fondamentales en mathématiques (statistiques en grande dimension, algèbre d'opérateur, combinatoire, théorie des nombres, ...) et en physique (physique nucléaire, théorie quantique des champs, chaos quantique, ...). Leur utilisation en traitement statistique du signal et analyse des séries temporelles est en revanche plus récente. Elles s'avèrent être utiles quand les observations sont issues de séries temporelles multivariées de grande dimension (notée M) et que la taille de l'échantillon (noté N) n'est pas beaucoup plus grande que M, une situation qui devient très courante en raison du développement spectaculaire des dispositifs d'acquisition de données et des réseaux de capteurs. Ce contexte soulève un certain nombre de questions qui sont beaucoup étudiées par les chercheurs de la communauté des statistiques en grande dimension. L'exemple le plus parlant est lié au problème fondamental de l'estimation de la matrice de covariance car il est connu que son estimateur empirique classique se comporte mal quand N n'est pas significativement plus grand que M. Par conséquent, les schémas d'inférence statistique conventionnels basés sur des fonctionnelles de la matrice de covariance empirique peuvent mal se comporter. Afin de résoudre ce type de problème, les approches les plus populaires proposées sont basées sur une hypothèse de parcimonie des paramètres sous jacents. Malheureusement cette hypothèse n'est pas toujours valide. L'application de la théorie des grandes matrices aléatoires est une alternative prometteuse car, sous certaines hypothèses, il est possible de comprendre le comportement de fonctionnelles de la matrice de covariance empirique quand M et N sont simultanément grand, et d'utiliser ces résultats afin de proposer de nouvelles techniques d'inférence plus performantes. Bien qu'un certain nombre de travaux récents aillent dans cette direction, il reste un travail considérable à accomplir pour étudier des schémas d'inférence statistique basés sur des estimateurs empiriques des statistiques du second ordre de séries temporelles de grande dimensions. Le travail proposé est donc à l'interface entre grandes matrices aléatoire et statistiques des séries temporelles multivariées.

  • Titre traduit

    Behaviour of non parametric estimators of second order statistics of high dimensional time series: a large random matrix approach.


  • Résumé

    Large random matrices have been proved to be of fundamental importance in mathematics (high dimensional probability, operator algebras, combinatorics, number theory,...) and in physics (nuclear physics, quantum fields theory, quantum chaos,..) for a long time. The use of large random matrices is more recent in statistical signal processing and time series analysis. The corresponding tools turn out to be useful when the observation is a large dimension (say M) multivariate time series and the sample size N is not much larger than M, a situation that becomes very common due to the spectacular development of data acquisition devices and sensor networks. This context poses a number of new difficult statistical problems that are intensively studied by the high-dimensional statistics community. The most significant example is related with the fundamental problem of estimating the covariance matrix of the observation because the standard empirical covariance matrix is known to perform poorly if N is not significantly larger than M. As a result, the conventional statistical inference schemes that are based on functionals of the empirical covariance matrix may perform poorly. In order to mitigate this conceptual difficulty, the most popular approaches were based on the design of inference schemes using some possible degree of sparsity of the underlying parameters. However, sparsity is a property that does not necessarily hold. The use of large random matrix theory is an appealing alternative because, under some assumptions on the observations, it is possible to precise the behaviour of certain functionals of the empirical covariance matrix when M and N are both large, and to use the corresponding results in order to design new improved performance inference schemes. While some papers produced a number of valuable results, a considerable work remains to be done to exploit the potential of large random matrix technics in the context of statistics of high-dimensional Gaussian time series. The proposed research topics are thus at the interface between large random matrices and the statistics of multivariate time series.