Analyse des réseaux sociaux pour enrichir et segmenter les profils utilisateurs

par Julien Hay

Projet de thèse en Informatique

Sous la direction de Yolaine Bourda et de Bich-Liên Doan.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec LRI - Laboratoire de Recherche en Informatique (laboratoire) , MODHEL - Modélisation Hétérogène (equipe de recherche) et de CentraleSupélec (2015-....) (établissement de préparation de la thèse) depuis le 20-03-2017 .


  • Résumé

    Ce travail de recherche se positionne dans la continuité de la thèse [21] effectuée au laboratoire LRI. Il vise à améliorer et développer de nouveaux algorithmes de segmentation et d'enrichissement des profils utilisateurs [17,18] tout en validant leur application dans le cadre de la plateforme industrielle Octopeek. Dans le cadre de cette thèse, nous mettrons en place des méthodes d'extraction et d'analyse des données internes aux réseaux sociaux mais également issues d'autres sources de données en vue de leur réutilisation dans la plateforme Octopeek. Néanmoins, la réalisation d'un tel système demeure un défi scientifique qui devra prendre en compte le volume de données, le temps d'exécution de la recherche et la sémantique des termes afin de fournir les meilleures réponses. En effet, pour chaque information recherchée, il faudra trouver la méthode, l'algorithme optimisé qui prend en compte la rapidité de calcul, et le scoring associé. Nous serons amenés à implémenter des algorithmes pour une utilisation à la volée et sur plusieurs personnes en parallèle.

  • Titre traduit

    Social networks analysis for enriching and segmenting user profiles


  • Résumé

    This research work is positioned in the continuity of the thesis [21] carried out in the LRI laboratory. It aims to improve and develop new algorithms for segmentation and user profiles enrichment [17,18] while validating their application within the framework of the Octopeek industrial platform. As part of this thesis, we will establish methods which can extract and analyse the social networks datas but also from other data sources with a view to their reuse in the Octopeek platform. Nevertheless, the realization of such a system remains a scientific challenge which have to take into account large data sets, the time complexity of the reseach process and the language semantic in order to provide the best answers. Indeed, for each information sought, it will be necessary to find the method, the optimized algorithm which takes into account the speed of calculation, and the associated scoring. We will implement algorithms for a on the fly usage and on several people in parallel.