Human Habits Investigation : from Mobility Reconstruction to Mobile Traffic Prediction

par Guangshuo Chen

Thèse de doctorat en Informatique

Sous la direction de Aline Carneiro Viana.

Le président du jury était Marcelo Dias De Amorim.

Le jury était composé de Aline Carneiro Viana, Marcelo Dias De Amorim, J?r?me H?rri, Lila Boukhatem, Ana Aguiar.

Les rapporteurs étaient Andr?-Luc Beylot.

  • Titre traduit

    L'?tude des habitudes humaines : de la reconstruction de la mobilit? ? la pr?diction du trafic mobile


  • Résumé

    La capacit? ? pr?voir les activit?s humaines a des implications essentielles dans de nombreux aspects des r?seaux cellulaires. En particulier, la haute disponibilit? de la pr?diction de la mobilit? peut permettre diff?rents sc?narios d'application; une meilleure compr?hension de la demande de trafic de donn?es mobiles peut aider ? am?liorer la conception de solutions pour l'?quilibrage de la charge du r?seau. Bien que de nombreux chercheurs aient ?tudi? le sujet de la pr?diction de la mobilit? humaine, il y a eu peu de discussions sur l'anticipation du trafic de donn?es mobiles dans les r?seaux cellulaires.Pour comprendre la mobilit? humaine, les ensembles de donn?es de t?l?phones mobiles, consistant en des enregistrements de donn?es de taxation (CDR), constituent un choix pratique d'empreintes humaines. Comme le d?ploiement du r?seau cellulaire est tr?s irr?gulier et que les fr?quences d'interaction sont g?n?ralement faibles, les donn?es CDR sont souvent caract?ris?es par une parcimonie spatio-temporelle qui, ? son tour, peut biaiser les analyses de mobilit? bas?es sur de telles donn?es et provoquer la perte de trajectoires individuelles.Dans cette th?se, nous pr?sentons de nouvelles solutions de reconstruction de trajectoires individuelles et de pr?diction de trafic de donn?es mobiles individuelles. Nos contributions abordent les probl?mes de (1) surmonter l'incompl?tude des informations de mobilit? pour l'utilisation des ensembles de donn?es de t?l?phonie mobile et (2) pr?dire la future demande de trafic de donn?es mobiles pour le support des applications de gestion de r?seau.Premi?rement, nous nous concentrons sur la faille de l'information sur la mobilit? dans les ensembles de donn?es de t?l?phones mobiles. Nous rapportons une analyse en profondeur de son effet sur la mesure des caract?ristiques de mobilit? individuelles et l'exhaustivit? des trajectoires individuelles. En particulier, (1) nous fournissons une confirmation des r?sultats ant?rieurs concernant les biais dans les mesures de mobilit? caus?es par la raret? temporelle de la CDR; (2) nous ?valuons le d?calage g?ographique provoqu? par la cartographie des emplacements des utilisateurs vers les tours cellulaires et r?v?lons le biais caus? par la raret? spatiale de la CDR; (3) nous fournissons une estimation empirique de l'exhaustivit? des donn?es des trajectoires CDR individuelles. (4) nous proposons de nouvelles solutions de compl?tion CDR pour reconstruire incompl?te. Nos solutions tirent parti de la nature des mod?les de mouvements humains r?p?titifs et des techniques d'inf?rence de donn?es de pointe et surpassent les approches pr?c?dentes illustr?es par des simulations ax?es sur les donn?es.Deuxi?mement, nous abordons la pr?diction des demandes de trafic de donn?es mobiles g?n?r?es par les abonn?s individuels du r?seau mobile. Sur la base de trajectoires compl?t?es par nos solutions d?velopp?es et nos historiques de consommation de donn?es extraites d'un ensemble de donn?es de t?l?phonie mobile ? grande ?chelle, (1) nous ?tudions les limites de pr?visibilit? en mesurant la pr?visibilit? maximale que tout algorithme peut atteindre. les approches de pr?diction du trafic de donn?es mobiles qui utilisent les r?sultats de l'analyse th?orique de la pr?visibilit?. Notre analyse th?orique montre qu'il est th?oriquement possible d'anticiper la demande individuelle avec une pr?cision typique de 75% malgr? l'h?t?rog?n?it? des utilisateurs et avec une pr?cision am?lior?e de 80% en utilisant la pr?diction conjointe avec des informations de mobilit?. Notre pratique bas?e sur des techniques d'apprentissage automatique peut atteindre une pr?cision typique de 65% et avoir un degr? d'am?lioration de 1% ? 5% en consid?rant les d?placements individuels.En r?sum?, les contributions mentionn?es ci-dessus vont dans le sens de l'utilisation des ensembles de donn?es de t?l?phonie mobile et de la gestion des op?rateurs de r?seau et de leurs abonn?s.


  • Résumé

    The understanding of human behaviors is a central question in multi-disciplinary research and has contributed to a wide range of applications. The ability to foresee human activities has essential implications in many aspects of cellular networks. In particular, the high availability of mobility prediction can enable various application scenarios such as location-based recommendation, home automation, and location-related data dissemination; the better understanding of mobile data traffic demand can help to improve the design of solutions for network load balancing, aiming at improving the quality of Internet-based mobile services. Although a large and growing body of literature has investigated the topic of predicting human mobility, there has been little discussion in anticipating mobile data traffic in cellular networks, especially in spatiotemporal view of individuals.For understanding human mobility, mobile phone datasets, consisting of Charging Data Records (CDRs), are a practical choice of human footprints because of the large-scale user populations and the vast diversity of individual movement patterns. The accuracy of mobility information granted by CDR depends on the network infrastructure and the frequency of user communication events. As cellular network deployment is highly irregular and interaction frequencies are typically low, CDR data is often characterized by spatial and temporal sparsity, which, in turn, can bias mobility analyses based on such data and cause the loss of whereabouts in individual trajectories.In this thesis, we present novel solutions of the reconstruction of individual trajectories and the prediction of individual mobile data traffic. Our contributions address the problems of (1) overcoming the incompleteness of mobility information for the use of mobile phone datasets and (2) predicting future mobile data traffic demand for the support of network management applications.First, we focus on the flaw of mobility information in mobile phone datasets. We report on an in-depth analysis of its effect on the measurement of individual mobility features and the completeness of individual trajectories. In particular, (1) we provide a confirmation of previous findings regarding the biases in mobility measurements caused by the temporal sparsity of CDR; (2) we evaluate the geographical shift caused by the mapping of user locations to cell towers and reveal the bias caused by the spatial sparsity of CDR; (3) we provide an empirical estimation of the data completeness of individual CDR-based trajectories. (4) we propose novel solutions of CDR completion to reconstruct incomplete. Our solutions leverage the nature of repetitive human movement patterns and the state-of-the-art data inference techniques and outperform previous approaches shown by data-driven simulations.Second, we address the prediction of mobile data traffic demands generated by individual mobile network subscribers. Building on trajectories completed by our developed solutions and data consumption histories extracted from a large-scale mobile phone dataset, (1) we investigate the limits of predictability by measuring the maximum predictability that any algorithm has potential to achieve and (2) we propose practical mobile data traffic prediction approaches that utilize the findings of the theoretical predictability analysis. Our theoretical analysis shows that it is theoretically possible to anticipate the individual demand with a typical accuracy of 75% despite the heterogeneity of users and with an improved accuracy of 80% using joint prediction with mobility information. Our practical based on machine learning techniques can achieve a typical accuracy of 65% and have a 1%~5% degree of improvement by considering individual whereabouts.In summary, the contributions mentioned above provide a step further towards supporting the use of mobile phone datasets and the management of network operators and their subscribers.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : École polytechnique. Bibliothèque Centrale.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.