Médias sociaux et gestion de communautés - applications dans le domaine de la gestion de la relation client

par Ian Basaille gahitte

Thèse de doctorat en Informatique

Sous la direction de Nadine Cullot et de Éric Leclercq.

Thèses en préparation à Bourgogne Franche-Comté , dans le cadre de École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; Dijon ; Belfort) , en partenariat avec LE2I - Laboratoire d'Electronique, d'Informatique et de l'Image (laboratoire) .


  • Résumé

    La gestion de la relation client (GRC, ou CRM en anglais), est un terme ayant émergé au milieu des années 1990, souvent utilisé pour décrire des outils informatisés offrant des prestations de services à des consommateurs avant, pendant et après un achat. Ces consommateurs ont suivit la transformation du Web qui a lieu depuis quelques années, où tout utilisateur devient fournisseur de contenu au moyen d'outils comme, notamment, les réseaux sociaux avec le partage de ressources, de contenu et les mécanismes d'annotation. Les réseaux sociaux grand public, tels que Facebook ou Twitter, sont maintenant utilisés quotidiennement par un très grand nombre d'utilisateurs. Les entreprises doivent suivre cette évolution et intégrer les réseaux sociaux comme nouveau canal de communication afin de pouvoir interagir avec leurs clients et prospects, et réciproquement. Ainsi, le Social CRM ou s-CRM, constitue l'évolution du CRM liée à l'intégration des médias sociaux dans le cadre d'outils de gestion de la relation client. Cette évolution doit permettre de prendre en compte la richesse des données présentes sur les réseaux sociaux et les valoriser. Les données produites par les les réseaux sociaux en ligne ont un potentiel de valorisation très important dans le cadre du CRM. De nombreux outils algorithmiques ont été développés pour analyser ces données. Cependant, afin de prendre en compte cette diversité, aussi bien en matière de données, d'algorithmes, que d'usages, il est nécessaire d'élaborer une plateforme générique utilisable par des spécialistes du domaine métier. Cette plateforme devra permettre de gérer la collecte, le stockage ainsi que l'analyse et la visualisation des données issues des réseaux sociaux. Afin de répondre aux multiples besoins de l'analyse des données sociales (analyse de communautés, identification d'utilisateur influents, détections d'événements, etc.), et de réduire le temps de mise en forme des données pour des analyses en temps réel, tout en accédant rapidement à de grandes quantités de données, plusieurs paradigmes de modélisation des données (en vue de leur stockage) doivent être envisagés. La sémantique, abordée dans notre cas comme la contextualisation des données ou des résultats des algorithmes par rapport à la connaissance du domaine, ainsi que la modélisation des données issues des réseaux sociaux par des graphes ou des profils utilisateurs, constituent les deux fils conducteurs de nos recherches. Nous proposons une méthode de détection et de caractérisation d'événements ne nécessitant pas de paramètre spécifique, hormis une fenêtre temporelle pour détecter des événements courts ou longs. La caractérisation des événements détectés est réalisée par une contextualisation au moyen des hashtags les plus représentatifs sur la période détectée. Nous proposons également une méthode détection de l'influence s'appuyant sur un graphe orienté et pondéré, exploitant l'algorithme HITS. Les différents algorithmes sont validés avec des données réelles. Un proof of concept de plateforme, appelé SNFreezer, a été développé et a permis de valider plusieurs des fonctionnalités au travers de différents projets. Nous avons validé la scalabilité de la plateforme au niveau de la collecte et du stockage des données. Cette plateforme a servi de point de départ pour une implémentation plus industrielle. Cette dernière est liée au développement du projet DisCoCRM, qui s'inscrit dans la démarche des sociétés eb-Lab et Teletech International d'intégrer les réseaux sociaux dans leur offre d'outils CRM, initiée avec le début de ma thèse.

  • Titre traduit

    Social medias and community management applied to client relationship management


  • Résumé

    Customer relationship management (CRM) is a term that emerged in the middle of the 1990's, and that is often used to describe computerized tools that provide services to consumers before, during and after a sale. These consumers have followed the transformation of the Web that has happened in the last few years, where each user becomes a supplier of content using tools like, amongst others, social networks by sharing resources, content, and annotating. General use social networks, such as Facebook or Twitter, are now used daily by a very large number of users. Companies have to follow this evolution and include social networks as a new communication channel in order to interact with their clients and prospects, and vice versa. Social CRM, or s-CRM, is the CRM evolution linked to the integration of social networks in the tools used to customer relationship management. This evolution has to take into account the richness of the social networks data and take advantage of them. Social network data have a great potential of adding value to CRM. Several tools have been developed to analyse them. However, in order to take into account the diversity, in terms of data, algorithms and use, a generic platform that can be used by experts has to be developed. This platform will have to manage the collection, storing and analysis and visualisation of social network data. In order to answer the multiple needs related to the social network data analysis (community analysis, influential users identification, event detection, etc.), and to reduce the data formatting time for real time analysis, while quickly accessing large amount of data, several data modelling paradigms (so as to store them) have to be considered. Semantics, which we see as the contextualization of data or the results of the algorithms in relation to the domain knowledge, and also social network data modelling with graphs or user profiles, are the two central themes of our research. We submit a community detection and event characterization that doesn't use any specific parameter, except for a time window used to detect long or short events. The events are characterized by contextualizing with the most representative hashtags on the detected period. We also submit an influence detection method using weighted and directed graph and the HITS algorithm. The various algorithms are validated with real world data. A proof of concept of platform, called SNFreezer, has been developed and used to validate several features through various projects. We validated the data collection and storing scalability of the platform. This platform was the starting of a more industrial implementation. This was linked to the DisCoCRM project that is part of the will, initiated with the beginning of my thesis, of eb-Lab and Teletech International to integrate social networks into their CRM tools.