Exploitation et fusion de connaissances locales pour la recherche d'informations précises

par Anne-Laure Ligozat

Thèse de doctorat en Informatique

Sous la direction de Michèle Jardino.

Soutenue en 2006

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .


  • Résumé

    Si les moteurs de recherche actuels sont efficaces pour trouver des documents correspondant à un besoin d'information large, c'est-à-dire pour fournir une liste de documents sur un sujet donné, ils répondent moins bien à un besoin d'information précise comme ``Qui était le président des Etats-Unis en 1978 ?''. Les systèmes de questions-réponses tentent de répondre à de tels besoins. La requête par mots-clefs d'un moteur de recherche classique est remplacée par une question, donc une requête en langage naturel, et la sortie est constituée de la réponse précise à la question, au lieu d'une liste de documents à parcourir. Le domaine de questions-réponses tire ainsi parti des possibilités actuelles en Recherche d'Information (RI), mais lui apporte une interaction facilitée avec l'utilisateur, grâce à la manipulation et la compréhension du langage naturel hérités du Traitement Automatique des Langues (TAL). L'objectif de ce travail est d'étudier précisément comment accéder à l'information précise recherchée, et en particulier ce qui caractérise une réponse à une question d'un point de vue du TAL. Nous nous demanderons ainsi ce que peut être une réponse à une question et quel niveau de connaissances linguistiques doit être utilisé par le système pour reconnaître le lien entre une question et une réponse potentielle. Nous nous sommes intéressée à la problématique de ce lien entre question et réponse sous un angle syntaxique, afin de déterminer l'impact de ce type de connaissances dans un procesus de recherche d'information précises.

  • Titre traduit

    Exploitation and fusion of local knowledge for precise information retrieval


  • Résumé

    If present search engines allow to find documents corresponding to a large information need, they are not adapted to a precise information need, such as "Who was the president of the United States in 1978?". Question answering system aim at fulfilling such needs. The keyword request of a classical search engine is replaced by a question, thus in natural language, and the output consists in the precise answer to the question, instead of a list of documents to read. The question answering domain benefits from works in Information Retrieval (IR), but gives the user a facilitated interaction, thanks to the manipulation and comprehension of natural language of the Natural Language Processing domain (NLP). The goal of this work is to study how to access to a precise information, and in particular what characterizes an answer to a question. The level of linguistic knowledge needed for the system to recognize the link between a question and a potential answer is examined. The issue of the link between question and answer is studied on a syntactic level, in order to determine the impact of this type of knowledge in a precise information retrieval process.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (148 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 127-135

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2006)268
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.