De la paraphrase linguistique à la recherche d'information, le système 3 AD : théorie et implantation (aide à l'analyse automatique du discours)

par Ismail Timimi

Thèse de doctorat en Informatique et communications

Sous la direction de JACQUES ROUAULT.

Soutenue en 1999

à Grenoble 3 .


  • Résumé

    Chercheurs et praticiens sont souvent confrontes a une double exigence : d'une part, le recueil de donnees textuelles provenant de differents corpus et bases documentaires ; d'autre part, le developpement d'outils d'informatiques destines a la gestion et a l'analyse de ces donnees. Comme contribution au rapprochement de ces deux volets, nous explorons dans ce travail, l'analyse de l'information discursive a partir d'un modele algebrique, ameliore par des formalismes linguistiques. Nous presentons la theorie de la methode definie ainsi que l'implantation du logiciel afferent, dit 3ad (aide a l'analyse automatique du discours). Dans une premiere partie, nous introduisons d'abord un rappel sur la theorie de la paraphrase, (application d'origine de 3ad). Ensuite, nous presentons les algorithmes mathematiques de 3ad. Ils calculent des distances entre les differentes phrases du corpus, a partir de matrices de couts liees aux operations classiques sur les mots : insertion, effacement et substitution. De facon generale, plus le nombre de mots communs a deux phrases est grand, plus la distance est petite, et par suite, plus elles seront en paraphrase. L'integration des outils graphiques del'analyse des donnees multidimensionnelles permet de visualiser sur des cartes, la disposition des phrases au sein des classes de paraphrases. Enfin, nous developpons un formalisme linguistique pour augmenter les performances de cette approche numerique. Ce formalisme integre plusieurs niveaux d'analyse en tal (morphologie, segmentation, syntaxe, semantique). Dans une seconde partie, nous proposons une autre facette du systeme 3ad, orientee vers une nouvelle application, qu'est la recherche d'information et ses derives. Nous montrons comment utiliser le systeme 3ad, comme un outil d'aide a la representation du contenu du document (extraction, filtrage et resume automatique) ; comment le systeme 3ad contribue a synthetiser les documents volumineux et apparier ces syntheses avec des requetes ; comment utiliser 3ad comme un outil de classification automatique (avec des scores pour chaque requete) ; comment 3ad peut cooperer avec un generateur de paraphrases en langue naturelle, pour les reformulations de requetes (en vue d'endiguer le bruit et le silence). Nous finirons par esquisser des possibilites de developpement de 3ad. Ces possibilites visent a relever un defi pour la ri, a savo


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 365 f
  • Notes : Publication autorisée par le jury

Où se trouve cette thèse ?

  • Bibliothèque : Service Interétablissement de la documentation (Saint-Martin-d'Hères, Isère). Bibliothèque universitaire Droit-Lettres.
  • Disponible pour le PEB
  • Cote : TL 205143/1999/25
  • Bibliothèque : Service Interétablissement de la documentation (Saint-Martin-d'Hères, Isère). Bibliothèque universitaire Droit-Lettres.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.