Fouille de données de trajectoires client pour applications d'achat dans des centres commerciaux

par Safa Ben Youssef

Projet de thèse en Mathématiques et Informatique

Sous la direction de Titus Bogdan Zaharia et de Bruno Andriamiarina.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec Télécom SudParis (France) (laboratoire) , ARMEDIA (equipe de recherche) et de Institut national des télécommunications (Evry) (établissement de préparation de la thèse) depuis le 12-04-2018 .


  • Résumé

    Pour atteindre les objectifs, il est nécessaire de considérer et d'aborder en parallèle plusieurs axes méthodologiques. Dans un premier temps, il s'agit d'élaborer un modèle de trajectoire suffisamment générique et flexible pour prendre en compte à la fois les parcours des utilisateurs que les principaux types de produit correspondant aux différents rayons, comme ceux que l'on rencontre habituellement dans les grandes surfaces. En terme d'analyse de données, un premier défi à relever concerne la spécification de mesures de similarité pertinentes, pouvant répondre à des objectifs de requêtes, d'alignement partiel ou bien d'identification de sous-trajectoires dominantes. Un deuxième axe qui sera développé concernera l'apprentissage automatique de profils et type de comportements d'utilisateurs. Outre le modèle de représentation qui sera spécifié, cela implique la mise en œuvre d'algorithmes d'apprentissage automatique. Un dernier axe de développement va aborder les éléments de prédiction, selon plusieurs niveaux et granularités, incluant la prédiction des trajectoires mêmes des utilisateurs, l'identification des corrélations entre les produits achetés, ou encore les éléments relatifs au processus de vente (indicateurs de vente des produits, passage en caisse). Soulignons enfin que la quantité des données croît actuellement de manière exponentielle. Ces arguments justifient donc la mise en place d'un environnement de type Big Data, s'appuyant sur des bases de données de tyoe NoSQL et technologies Cloud, pour permettre le stockage et le traitement efficace d'un tel volume de données et assurer le passage à l'échelle en conditions réelles.

  • Titre traduit

    Trajectory data mining for shopping applications


  • Résumé

    Several methodological axes will be considered and addressed. A first phase will concern the development of a sufficiently generic and flexible trajectory model, able to take into account both the user's itineraries and the main product types usually existing in supermarkets. In terms of data analysis, a first challenge will be the specification of relevant similarity measures, which can enables queries, partial alignment or identification of dominant sub-trajectories. A second axis of research will concern the automatic learning of user profiles and types of behaviors and will rely on machine learning algorithms. A final development axis will address the prediction methodologies. A generic solution is here expected, able to model and take into account various levels of granularity, including the prediction of the user's own trajectories, the identification of the correlations between the products purchased, and the elements relating to the sales process (sales indicators, number of customers…). Finally, in order to ensure the scalability of the proposed solutions in real-world conditions, a Big Data environment will be considered and deployed, based on NoSQL databases and Cloud technologies.