Méthodes d'amélioration de la pertinence des réponses dans un système de bases de données textuelles

par Hary Pierre Radasoa

Thèse de doctorat en Informatique

Sous la direction de Christian Fluhr.

Soutenue en 1988

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .


  • Résumé

    Lors d'une recherche documentaire, la question que l'utilisateur pose, est exprimée à l'aide de mots qui peuvent être différents de ceux contenus dans les documents mais relatant les mêmes notions. Cela est un problème général de la paraphrase. La reformulation est une solution à ce problème. Le rôle de la reformulation est de trouver un chemin pour apparier les notions (mots, groupes de mots, expressions, phrases,. . . ) contenues dans les documents et dans la question. La reformulation consiste à localiser ces notions et à amplifier la reconnaissance de leur proximité sémantique, donc celle de la proximité sémantique entre les documents et la question. Le but est de diminuer le "silence" qui correspond à la non- proposition de documents pertinents. Cependant, la reformulation ne doit pas engendrer du "bruit" qui correspond à la proposition de documents non pertinents. La diminution du silence et du bruit permet d'augmenter la précision des réponses. Les différentes méthodes de reformulation pour améliorer la pertinence des réponses lors de la recherche documentaire, exposées dans ce travail, sont : - la normalisation ; - les mots de la même famille ; - le thésaurus ; - le correcteur de fautes d'orthographe ; - l'explicitation ; - l'apprentissage de règles de reformulation ; -et l'interrogation par partie de document. Parmi ces méthodes, la normalisation et l'explicitation sont présentées en s'appuyant sur des travaux antérieurs ; les mots de la même famille, le correcteur de fautes d'orthographe et l'interrogation par partie de document sont améliorés ; le thésaurus et l'apprentissage de règles de reformulation sont étudiés. Chaque méthode de reformulation exploite des règles de reformulation. Ces règles de reformulation sont caractérisées par un type de relation évaluant la proximité sémantique entre les mots mis en relation. Ces règles sont facilement modifiables. Le système de recherche documentaire SPIRIT qui comporte un traitement linguistique et un traitement statistique, a été utilisé pour la validation de nos expérimentations sur la reformulation. Des modifications ont été apportées au niveau du module de comparaison afin de pouvoir prendre en compte la reformulation. Un système expert est proposé pour piloter la reformulation. Les bases de connaissances sont constituées par des groupes de règles correspondant aux différentes méthodes de reformulation. Le mécanisme d'inférence est régi par des métarègles contrôlant chaque processus de reformulation ainsi que l'enchaînement de tous les processus de reformulation.

  • Titre traduit

    Methods for improving answer relevance in a textual database system


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (156 f.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. [142]-149

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Versailles Saint-Quentin-en-Yvelines. Direction des Bibliothèques et de l'Information Scientifique et Technique-DBIST. Bibliothèque universitaire Sciences et techniques.
  • Non disponible pour le PEB
  • Cote : T880040
  • Bibliothèque : Université de Versailles Saint-Quentin-en-Yvelines. Direction des Bibliothèques et de l'Information Scientifique et Technique-DBIST. Bibliothèque universitaire Sciences et techniques.
  • Disponible pour le PEB
  • Cote : T880040
  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(1988)403
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : TH2014-035253

Cette version existe également sous forme de microfiche :

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.