Thèse soutenue

Constitution de fils de discussion cohérents à partir de conversations issues d’outils professionnels de communication et de collaboration

FR  |  
EN
Auteur / Autrice : Lionel Tadonfouet Tadjou
Direction : Laurent RomaryEric Villemonte de la Clergerie
Type : Thèse de doctorat
Discipline(s) : Sciences et technologies de l'information et de la communication
Date : Soutenance le 19/10/2023
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Centre de recherche de Paris (Paris)
Jury : Président / Présidente : Iris Eshkol
Examinateurs / Examinatrices : Sylvain Lamprier
Rapporteurs / Rapporteuses : Chloé Clavel, Frédéric Béchet

Résumé

FR  |  
EN

Constituer des fils de conversations cohérents à partir de conversations issues d’outils professionnels de communication et de collaboration est un processus de transformation d’une conversation écrite et asynchrone en sous-conversations. Chacune de ces sous-conversations traitant d’un sujet spécifique tout en gardant l’ordre d’arrivée des messages émis par les interlocuteurs dans la conversation originale. Ces sous-conversations donnent ainsi lieu à des structures de conversations linéaires ou arborescentes. Ce processus peut s’appliquer sur les discussions de forum mais aussi sur des conversations d’emails, ces deux exemples étant plus généralement des représentants de Contenus Médiés Par Ordinateur (CMO). Pour constituer ces sous-fils de conversations d’emails, il est nécessaire de s’appuyer sur les métadonnées de ceux-ci et leurs contenus. Néanmoins, ces éléments ne nous semblent pas suffisants en pratique. En effet, une conversation par email est en fait un dialogue avec une structure discursive potentiellement utile pour suivre l’évolution de la discussion. Il faut cependant noter que ce dialogue est asynchrone, ce qui introduit des spécificités. Dans les dialogues synchrones, il ressort très souvent des relations très fortes entre des énoncés consécutifs qui dans un long échange peuvent ainsi constituer des clusters de sous-conversations. Pour constituer des sous-fils de conversations à partir de conversations originales d’emails, nous nous appuyons sur ce type de relations entre les phrases d’emails successifs : ces relations sont dites transverses. Contrairement aux dialogues où ces relations peuvent facilement être identifiées, ceci est une tâche très complexe pour ce qui est des conversations d’emails et constitue la principale sous-problématique nommée appariement d’énoncés pour laquelle nous proposons des approches de résolution. Les conversations regorgent généralement beaucoup d’informations linguistiques et paralinguistiques, les actes de dialogue en font partie, ils aident très souvent à mieux cerner le contenu d’un échange et pourrait fortement contribuer à constituer des sous-fils de conversations via une meilleure identification des relations entre des énoncés. Ceci est l’hypothèse que nous posons dans le cadre de la résolution du problème d’appariement d’énoncés, s’appuyant sur une première phase de classification d’énoncés de dialogues. Dans le manuscrit, nous présentons les travaux connexes à notre problématique de base, ainsi que les sous-problématiques mentionnées ci-dessus. Autour de cet axe de travail principal, nous abordons divers aspects connexes mais importants, nécessaires ou utiles. Ainsi, nous abordons de façon approfondie ce que sont les CMO, l’analyse discursive et son historicité ainsi que les corpus disponibles pour approcher de tels problèmes. Ensuite nous proposons différentes approches de résolution de nos sous-problématiques avec des expériences bien détaillées et des évaluations de nos approches. Enfin, notre manuscrit se clôture sur des propositions telles que : l’application des approches proposées à d’autres types de CMO comme les forums et d’autres pistes à explorer pour résoudre la problématique de constitution de sous-fils de conversation.