Analyse linguistique outillée des corpus de tweets politiques : Détection de l'ironie, du sarcasme et du second degré.

par Abdelouafi El Otmani

Projet de thèse en Sciences du langage - Cergy

Sous la direction de Julien Longhi et de Boris Borzic.

Thèses en préparation à Cergy-Pontoise , dans le cadre de ED DSH - Droit et Sciences Humaines , en partenariat avec AGORA (laboratoire) depuis le 01-11-2017 .


  • Résumé

    Les travaux existants en analyse des discours numériques, en particulier les tweets, se concentrent en général, et selon les disciplines, sur la constitution de réseaux ou de communautés d'échanges, sur les thèmes ou sujets (topics) abordés, sur la polarité des messages (positifs ou négatifs), ou encore sur les spécificités stylistiques ou discursives liées au médium. Ce projet de thèse souhaite se concentrer sur la tonalité des tweets politiques, notamment au prisme du triptyque sarcasme/ironie/second degré. Il s'agirait alors de mobiliser des connaissances en pragmatique linguistique et en énonciation, pour les rendre opérationnelles dans des systèmes de traitement automatisés. L'analyse outillée des discours articulerait une approche qualitative centrée sur la complexité des phénomènes linguistiques, et quantitative avec la recherche de régularités pouvant être implantées dans des traitements automatiques en les combinant avec des algorithmes issus de l'apprentissage cognitif. Le défi sera de prendre en compte toutes les dimensions d'un message comme la compréhension des hashtags présents, la recontextualisation de sa thématique en lien avec l'actualité, l'analyse du porteur du message, les relations interpersonnes et les interactions du message dans le graphe social. Après avoir fait un état de l'art des nombreux classifieurs et des différents modèles d'apprentissage supervisé, il s'agira de réfléchir sur la notion de méta-apprentissage afin d'avoir une approche réflexive sur les différentes dimensions liées à la détection du sarcasme/ironie/second degré, discipline en sciences informatiques désignée par l'expression « sarcasm mining ».

  • Titre traduit

    Linguistic analysis of political tweets: Detection of irony, sarcasm and second degree.


  • Résumé

    This thesis project aims to focus on the tonality of political tweets, especially according to the prism of the sarcasm/irony/second degree. The challenge will be to take into account all the dimensions of a message such as the comprehension of the hashtags, the recontextualization of its theme in relation to current events, the analysis of the author of the message, interpersonal relations and the interactions of the message in the social graph.