Un modèle pour l'analyse des sentiments sur les réseaux sociaux basé sur les systèmes multi-agents et la classification consensuelle

par David Oriedi (Opondo)

Projet de thèse en Sciences - STS

Sous la direction de Cyril De runz et de Zahia Guessoum.

Thèses en préparation à Reims en cotutelle avec Jomo Kenyatta University of Agriculture & Technology , dans le cadre de Ecole doctorale Sciences, technologies, santé (Reims, Marne) , en partenariat avec (CRESTIC) Centre de Recherches en STIC (laboratoire) et de Equipe SIC-CRESTIC (equipe de recherche) depuis le 20-09-2017 .


  • Résumé

    Les médias sociaux ont apporté de nombreux avantages. Cependant, il existe également des éléments négatifs associés aux médias sociaux qui, si non contrôlés, peuvent créer une inimitié inutile entre des groupes appartenant à des éthnies, religions ou tribus différentes. L'un des aspects les plus inquiétants des médias sociaux est l'utilisation par les gens pour initier, diffuser et maintenir un discours de haine entre différents groupes de personnes. Le gouvernement du Kenya, par exemple, reconnaît qu'il existe beaucoup d'échanges haineux entre ses citoyens sur les réseaux sociaux et en particulier sur les questions politiques. Beaucoup de travail qui a été fait sur la détection des mots haineux a simplifié la classification des mots haineux dans des catégories positives, négatives ou neutres. Cependant, la question de l'utilisation subjective des mots de haine reste encore largement ouverte. Le problème de l'utilisation subjective des mots de haine a trait au fait qu'un mot peut sembler inoffensif dans une circonstance, une communauté ou un environnement mais être très haineux dans un autre environnement. Cette thèse propose un mécanisme de classification et de détection pour ce type de mots. Il suggère l'utilisation d'une combinaison de systèmes multi-agents à utiliser pour collecter des ensembles de mots soupçonnés d'être haineux dans la nature grâce à une classification appropriée à l'instar des Forêts aléatoires. Après cela, leurs niveaux de négativité seront évalués grâce à l'analyse des sentiments afin qu'il existe un moyen de les tracer aux auteurs originaux chaque fois qu'ils sont utilisés pour faciliter les processus de poursuite. La sortie de ce travail sera un modèle qui pourra rassembler, tracer et documenter les mots haineux jugés haineux. Avec cela, la poursuite des mongeurs haineux en ligne devrait être possible. Le succès de ce travail sera une étape importante dans la réalisation d'une nation intégrée et cohésive au Kenya.

  • Titre traduit

    A MODEL FOR SENTIMENT ANALYSIS ON SOCIAL MEDIA BASED ON MULTI-AGENT SYSTEMS AND CONSENSUAL CLASSIFICATION


  • Résumé

    Social media has brought with it many benefits. However there are also negative elements associated with social media that, if not controlled, can create unnecessary enmity between groups of people that belong to different ethnics, religion or tribes. One of the most worrying aspects of social media is its usage by people to initiate, spread and maintain hate speech between and among different groups of people. The Kenya Government, for example, does recognize that there exists a lot of hate exchanges among its citizens on social media and in particular on political issues. A lot of work that has been done on hate word detection has simplified the classification of hate words into either positive, negative or neutral categories. However the issue of subjective use of hate words still remains largely open. The problem of subjective use of hate words has to do with the fact that a word might seem to be harmless in one circumstance, community or environment but be very hateful in another environment. This thesis proposes a classification and detection mechanism for such kind of words. It suggests the use of a combination of multi-agent systems to be used for collecting sets of words suspected to be hateful in nature through appropriate classification as for instance the random Forest Algorithm. After this, their levels of negativity will be assessed through sentiment analysis so that there is a way to trace them to original authors every time they are used to aid in prosecutorial processes. The output of this work will be a model that will be able to collect, trace and document hate words that are deemed to be hateful. With this, prosecuting online hate mongers should be possible. The success of this work is hopefully going to be a big milestone in achieving an integrated and cohesive nation in Kenya.