Approches et méthodologies pour la réponse automatique à des questions adaptées à un cadre interactif en domaine ouvert

par Olivier Galibert

Thèse de doctorat en Informatique

Sous la direction de Martine Adda-Decker.

Soutenue en 2009

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .


  • Résumé

    L'objectif de cette thèse a été de proposer de nouvelles approches robustes pour le problème de la réponse à des questions dans un cadre ouvert interactif. Notre première contribution a été la conception et mise en oeuvre d'un moteur générique d'analyse de la langue. C'est un moteur sans a-priori sur les types d'analyses qui peuvent être effectués, dans la limite de ce qu'il peut représenter et qui met en avant la structuration de l'analyse. Notre seconde contribution a consisté en la conception et la mise en oeuvre d'un Système Question-Réponse dont les principales forces sont flexibilité de l'entrée, la robustesse et le contrôle des performances. Cela se fait via une intégration de bout en bout du résultat de l'analyse, qui permet de ne manipuler que les structures résultantes de l'analyse sans devoir redescendre aux mots. Il propose aussi, et c'est une des grandes originalités de ce travail, une abstraction de la requête, source de sa flexibilité, et facilitant sa compréhension et sa maintenance. Nous avons participé à des campagnes d'évaluation internationales, où nos systèmes ont obtenu d'excellents résultats. En particulier, ils ont montré une bonne résistance aux erreurs induites par un système de transcription automatique de la parole. Il est cependant important de noter que notre but a été atteint. Le système global de Question-Réponse a les capacités nécessaires pour s'intégrer dans un système interactif. Il est utilisé dans le cadre du projet Ritel et a permis des premières expériences dont le but était d'étudier le comportement des humains face à un tel système et l'interaction homme-machine en domaine ouvert en général.

  • Titre traduit

    Approaches and methodologies for automatic Question-Answering in an open-domain, interactive setup.


  • Résumé

    The objective of this work is to introduce new robust approaches to handle the problem of Question Answering in an open-domain, interactive setup. Our first contribution is the design and implementation of a generic rules-based engine for language analysis. That engine is open to any kind of analysis, within the limits of its internal representation, and leverages an heavy structuring of the analysis. Our second contribution is the design and implementation of a Question-Answering system which main strengths are the flexibility of the input, the robustness and the explicit performance control. These characteristics have been reached through an end-to-end integration of the language analysis results, allowing to manipulate structures build by that analysis only, without having to go back to the individual words. Another advance, and it is one of its main originalities, is an abstraction of the request, enabling its flexibility and making diagnostic and maintenance easier. We participated to a number of international evaluation campaigns where our system achieved excellent results. In particular they have shown a good robustness to automatic speech recognition induced errors. It is important to note that our aim has been reached. The Question-Answering system has the necessary capabilities to be integrated in an interactive system. It is used in the Ritel project and allowed some preliminary experiences aiming at studying the human behavior in front of such a system, and human-machine interaction in general.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (184 p.)
  • Annexes : Bibliogr. p. 175-184

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2007)330
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.