Thèse soutenue

Modèles proactifs pour la recherche d'informations conversationnelles

FR  |  
EN
Auteur / Autrice : Pierre Erbacher
Direction : Laure Soulier
Type : Thèse de doctorat
Discipline(s) : Sciences et technologies de l'information et de la communication
Date : Soutenance le 31/01/2024
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche : Laboratoire : LIP6 (1997-....)
Jury : Président / Présidente : François Yvon
Examinateurs / Examinatrices : Sophie Rosset, Mohammad Aliannejadi
Rapporteurs / Rapporteuses : Alexandre Allauzen, Lynda Tamine-Lechani

Résumé

FR  |  
EN

Les systèmes conversationnels deviennent de plus en plus des passerelles importantes vers l'information dans un large éventail de domaines d'application tels que le service client, la santé, l'éducation, le travail de bureau, les achats en ligne et la recherche sur le Web. Même si les modèles linguistiques existants sont capables de suivre de longues conversations, de répondre à des questions et de résumer des documents avec une fluidité impressionnante, ils ne peuvent pas être considérés comme de véritables systèmes de recherche conversationnelle. Au-delà de fournir des réponses en langage naturel, une capacité clé des systèmes de recherche conversationnelle est leur participation (pro)active à la conversation avec les utilisateurs. Cela permet aux systèmes de recherche conversationnelle de mieux saisir les besoins des utilisateurs, mais également de les guider et de les assister lors des sessions de recherche. En particulier, lorsque les utilisateurs ne peuvent pas parcourir la liste des documents pour en évaluer la pertinence, comme dans les interactions purement vocales, le système doit prendre l'initiative de demander un contexte supplémentaire, de demander une confirmation ou de suggérer plus d'informations pour aider l'utilisateur à naviguer virtuellement et réduire sa charge cognitive. Cependant, en raison du coût élevé de la collecte et de l'annotation de ces données, les ensembles de données conversationnelles disponibles pour l'accès à l'information sont généralement petits, fabriqués à la main et limités à des applications spécifiques à un domaine telles que les recommandations ou la réponse aux questions conversationnelles, qui sont généralement initiées par l'utilisateur. et contiennent des questions simples ou une série de questions contextualisées. De plus, il est particulièrement difficile d'évaluer correctement les systèmes de recherche conversationnelle en raison de la nature des interactions. Dans cette thèse, nous visons à améliorer la recherche conversationnelle en permettant des interactions plus complexes et plus utiles avec les utilisateurs. Nous proposons plusieurs méthodes et approches pour atteindre cet objectif. Premièrement, dans les chapitres 1 et 2, nous étudions comment les simulations d'utilisateurs peuvent être utilisées pour former et évaluer des systèmes qui raffinent les requêtes via des interactions séquentielles avec l'utilisateur. Nous nous concentrons sur l'interaction séquentielle basée sur les clics avec une simulation utilisateur pour clarifier les requêtes.Ensuite, dans les chapitres 3 et 4, nous explorons comment les ensembles de données IR existants peuvent être améliorés avec des interactions simulées pour améliorer les capacités IR dans la recherche conversationnelle et comment les interactions à initiatives mixtes peuvent servir à la récupération de documents et à la désambiguïsation des requêtes. Dans le chapitre 4, nous proposons d'augmenter l'ensemble de données AmbigNQ avec des questions de clarification pour mieux former et évaluer les systèmes afin d'effectuer des tâches de réponse proactive aux questions, où les systèmes sont censés lever l'ambiguïté des questions initiales des utilisateurs avant de répondre. Enfin, dans le dernier chapitre, nous nous sommes concentrés sur l'interaction entre les systèmes et un moteur de recherche externe. Nous avons introduit une nouvelle méthode d'approche pour apprendre à un modèle de langage à évaluer en interne sa capacité à répondre correctement à une requête donnée, sans utiliser autre chose que les données comprises dans son apprentissage.