Human Habits Investigation : from Mobility Reconstruction to Mobile Traffic Prediction

par Guangshuo Chen

Thèse de doctorat en Informatique

Sous la direction de Aline Carneiro Viana.

Le président du jury était Marcelo Dias De Amorim.

Le jury était composé de Aline Carneiro Viana, Marcelo Dias De Amorim, Jérôme Härri, Lila Boukhatem, Ana Aguiar.

Les rapporteurs étaient André-Luc Beylot.

  • Titre traduit

    L'étude des habitudes humaines : de la reconstruction de la mobilité à la prédiction du trafic mobile


  • Résumé

    La capacité à prévoir les activités humaines a des implications essentielles dans de nombreux aspects des réseaux cellulaires. En particulier, la haute disponibilité de la prédiction de la mobilité peut permettre différents scénarios d'application; une meilleure compréhension de la demande de trafic de données mobiles peut aider à améliorer la conception de solutions pour l'équilibrage de la charge du réseau. Bien que de nombreux chercheurs aient étudié le sujet de la prédiction de la mobilité humaine, il y a eu peu de discussions sur l'anticipation du trafic de données mobiles dans les réseaux cellulaires.Pour comprendre la mobilité humaine, les ensembles de données de téléphones mobiles, consistant en des enregistrements de données de taxation (CDR), constituent un choix pratique d'empreintes humaines. Comme le déploiement du réseau cellulaire est très irrégulier et que les fréquences d'interaction sont généralement faibles, les données CDR sont souvent caractérisées par une parcimonie spatio-temporelle qui, à son tour, peut biaiser les analyses de mobilité basées sur de telles données et provoquer la perte de trajectoires individuelles.Dans cette thèse, nous présentons de nouvelles solutions de reconstruction de trajectoires individuelles et de prédiction de trafic de données mobiles individuelles. Nos contributions abordent les problèmes de (1) surmonter l'incomplétude des informations de mobilité pour l'utilisation des ensembles de données de téléphonie mobile et (2) prédire la future demande de trafic de données mobiles pour le support des applications de gestion de réseau.Premièrement, nous nous concentrons sur la faille de l'information sur la mobilité dans les ensembles de données de téléphones mobiles. Nous rapportons une analyse en profondeur de son effet sur la mesure des caractéristiques de mobilité individuelles et l'exhaustivité des trajectoires individuelles. En particulier, (1) nous fournissons une confirmation des résultats antérieurs concernant les biais dans les mesures de mobilité causées par la rareté temporelle de la CDR; (2) nous évaluons le décalage géographique provoqué par la cartographie des emplacements des utilisateurs vers les tours cellulaires et révélons le biais causé par la rareté spatiale de la CDR; (3) nous fournissons une estimation empirique de l'exhaustivité des données des trajectoires CDR individuelles. (4) nous proposons de nouvelles solutions de complétion CDR pour reconstruire incomplète. Nos solutions tirent parti de la nature des modèles de mouvements humains répétitifs et des techniques d'inférence de données de pointe et surpassent les approches précédentes illustrées par des simulations axées sur les données.Deuxièmement, nous abordons la prédiction des demandes de trafic de données mobiles générées par les abonnés individuels du réseau mobile. Sur la base de trajectoires complétées par nos solutions développées et nos historiques de consommation de données extraites d'un ensemble de données de téléphonie mobile à grande échelle, (1) nous étudions les limites de prévisibilité en mesurant la prévisibilité maximale que tout algorithme peut atteindre. les approches de prédiction du trafic de données mobiles qui utilisent les résultats de l'analyse théorique de la prévisibilité. Notre analyse théorique montre qu'il est théoriquement possible d'anticiper la demande individuelle avec une précision typique de 75% malgré l'hétérogénéité des utilisateurs et avec une précision améliorée de 80% en utilisant la prédiction conjointe avec des informations de mobilité. Notre pratique basée sur des techniques d'apprentissage automatique peut atteindre une précision typique de 65% et avoir un degré d'amélioration de 1% à 5% en considérant les déplacements individuels.En résumé, les contributions mentionnées ci-dessus vont dans le sens de l'utilisation des ensembles de données de téléphonie mobile et de la gestion des opérateurs de réseau et de leurs abonnés.


  • Résumé

    The understanding of human behaviors is a central question in multi-disciplinary research and has contributed to a wide range of applications. The ability to foresee human activities has essential implications in many aspects of cellular networks. In particular, the high availability of mobility prediction can enable various application scenarios such as location-based recommendation, home automation, and location-related data dissemination; the better understanding of mobile data traffic demand can help to improve the design of solutions for network load balancing, aiming at improving the quality of Internet-based mobile services. Although a large and growing body of literature has investigated the topic of predicting human mobility, there has been little discussion in anticipating mobile data traffic in cellular networks, especially in spatiotemporal view of individuals.For understanding human mobility, mobile phone datasets, consisting of Charging Data Records (CDRs), are a practical choice of human footprints because of the large-scale user populations and the vast diversity of individual movement patterns. The accuracy of mobility information granted by CDR depends on the network infrastructure and the frequency of user communication events. As cellular network deployment is highly irregular and interaction frequencies are typically low, CDR data is often characterized by spatial and temporal sparsity, which, in turn, can bias mobility analyses based on such data and cause the loss of whereabouts in individual trajectories.In this thesis, we present novel solutions of the reconstruction of individual trajectories and the prediction of individual mobile data traffic. Our contributions address the problems of (1) overcoming the incompleteness of mobility information for the use of mobile phone datasets and (2) predicting future mobile data traffic demand for the support of network management applications.First, we focus on the flaw of mobility information in mobile phone datasets. We report on an in-depth analysis of its effect on the measurement of individual mobility features and the completeness of individual trajectories. In particular, (1) we provide a confirmation of previous findings regarding the biases in mobility measurements caused by the temporal sparsity of CDR; (2) we evaluate the geographical shift caused by the mapping of user locations to cell towers and reveal the bias caused by the spatial sparsity of CDR; (3) we provide an empirical estimation of the data completeness of individual CDR-based trajectories. (4) we propose novel solutions of CDR completion to reconstruct incomplete. Our solutions leverage the nature of repetitive human movement patterns and the state-of-the-art data inference techniques and outperform previous approaches shown by data-driven simulations.Second, we address the prediction of mobile data traffic demands generated by individual mobile network subscribers. Building on trajectories completed by our developed solutions and data consumption histories extracted from a large-scale mobile phone dataset, (1) we investigate the limits of predictability by measuring the maximum predictability that any algorithm has potential to achieve and (2) we propose practical mobile data traffic prediction approaches that utilize the findings of the theoretical predictability analysis. Our theoretical analysis shows that it is theoretically possible to anticipate the individual demand with a typical accuracy of 75% despite the heterogeneity of users and with an improved accuracy of 80% using joint prediction with mobility information. Our practical based on machine learning techniques can achieve a typical accuracy of 65% and have a 1%~5% degree of improvement by considering individual whereabouts.In summary, the contributions mentioned above provide a step further towards supporting the use of mobile phone datasets and the management of network operators and their subscribers.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : École polytechnique. Bibliothèque Centrale.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.