Dimensions mémorielles des systèmes automatisés de dialogue en langage naturel : application aux agents conversationnels de la relation-client en domaine non ou faiblement contraint pour l'interaction écrite (chatbots)

by Léon-paul Schaub

Thesis project in Informatique

Under the supervision of Patrick Paroubek and Gil Francopoulo.

Ongoing thesis at Paris Saclay , under the authority of Sciences et Technologies de l'Information et de la Communication , in a partnership with LIMSI - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (laboratoire) , ILES - Information, Langue Ecrite et Signée (equipe de recherche) and Université Paris-Sud (établissement de préparation de la thèse) since 01-05-2018 .

  • Alternative Title

    On Memory in Automatic Natural Language Dialogue Systems: application to autonomous conversational agents for customer relationship in unconstrained or weakly constrained domain with written interaction (chatbots)


  • Abstract

    Since progress in automatic natural language analysis has made it possible to support fully finalized dialogue in a fully automatic style (e.g. travel reservation [1]), the systems are able to answer to questions about complex tasks and more open areas (eg IBM's WATSON system that won the jeopardy game show in 2011 [2]). Recently, standalone chat agents (known as chatbots) have become essential elements in customer relationship management [3]. In this context, the conversational agent function evolves more and more towards that of a virtual adviser from whom we expect an increasingly intelligent behavior going beyond the collection of information or providing simple answers, but also being able to make decisions such as taking actions and in particular recognizing one's own limitations and knowing when to hand over to a human advisor in order to preserve the quality of service. Technological lock A large number of chatbots exist on the market, from simple ones often elaborated with weakly contextual rules, to more complex based on machine learning. The former: quickly become silent if one goes beyond the limits of their field of competence, while the latter are capable of a little more generalization, but this is usually paid at the price of greater inaccuracy in their answers . Regardless of the type of system considered, everything is based on knowledge, that is, the memory of the conversational agent. In humans, memory is divided into several types [4] for example: episodic (lived events), semantics (knowledge), procedural (know-how), perceptive (recognition of voices, smells, etc.) or work (short-term notepad). It can be of explicit nature (conscious access and restitution), implicit (subconscious, emotions) or autobiographical (personal combining semantic and episodic memory). But these characteristics of the memory of an autonomous agent condition the representations that he constructs [5] and therefore its actions. In addition to the conversational agent's memory functions and their impact on the management of the dialogue, the scientific investigations will address the problem of adaptation to the application domain1 [8] and will have to address recent advances in machine learning (deep neural approaches). [6]), this at different levels of granularity (analysis of a statement, acquisition of background knowledge from corpus etc.). The validation of the intermediate experimental results will be carried out through the evaluation of demonstrators (prototype dialogue system) according to a corpus-based quantitative evaluation procedure with a set of performance measures defined from the classical evaluation protocols. for the domain [7].


  • Abstract

    Depuis que les progrès en analyse automatique du langage naturel ont rendu possible la prise en charge d'un dialogue finalisé de manière entièrement automatique (ex. réservation de voyage [1]), les système ont gagné en intelligence pour être capable de répondre à des questions sur des tâches complexes et des domaines plus ouverts (par ex. le système WATSON d'IBM qui a remporté en 2011 le jeux télévisé jeopardy [2]) . Récemment, les agents conversationnels autonomes (connus sous le nom de «chatbots») sont devenus des éléments incontournables dans la gestion de la relation client [3]. Dans ce contexte, la fonction d'agent conversationnel évolue de plus en plus vers celle de d'un conseiller virtuel duquel on attend un comportement de plus en plus intelligent allant au-delà de la collecte d'information ou fourniture de réponses simples, mais étant aussi capable de prendre des décisions comme par exemple effectuer des actions et en particulier de reconnaître ses propre limites et de savoir quand il convient de passer la main à un conseiller humain afin de préserver la qualité de service. Verrou technologique Un grand nombre de chatbots existent sur le marché, des plus simples souvent élaborés avec des règles faiblement contextuelles, aux plus complexes à base d'apprentissage automatique. Les premiers : deviennent vite silencieux si l'on sort des limites de leur domaine de compétence, tandis que les seconds sont capable d'un peu plus de généralisation, mais cela se paie en général au prix d'une plus grande imprécision dans leurs réponses. Quel que soit le type de système considéré, tout repose sur les connaissances, c'est-à-dire la mémoire de l'agent conversationnel. Chez l'humain, la mémoire se décline selon plusieurs types [4] par exemple: épisodique (événements vécu), sémantique (connaissances), procédurale (savoir-faire), perceptive (reconnaissance des voix, des odeurs etc.) ou de travail (bloc-note à court terme). Elle peut être de nature explicite (accès et restitution conscients), implicite (subconscient, émotions) ou autobiographique (personnelle associant mémoire sémantique et épisodique). Or ces caractéristiques de la mémoire d'un agent autonome conditionnent les représentations qu' il construit [5] et donc ses actions. Outre les fonctionalités mémorielles de l'agent conversationnel et leur impact sur la gestion du dialogue, les investigations scientifiques aborderont le problème de l'adaptation au domaine applicatif1 [8] et devront adresser dans ce cadre les avancées récentes en apprentissage automatique (approches neuronales profondes [6]), ceci à différent niveaux de granularité (analyse d'un énoncé, acquisition de connaissances de fond à partir de corpus etc.). La validation des résultat expérimentaux intermédiaires sera effectuée par le biais de l'évaluation de démonstrateurs (système de dialogue prototypes) selon une procédure d'évaluation quantitative à base de corpus avec un ensemble de mesures de performance définies à partir des protocoles d'évaluation classiques pour le domaine [7].