Construction et interrogation de la structure informationnelle d'une base documentaire en français

par Bernard Jacquemin

Thèse de doctorat en Sciences du langage. Linguistique et informatique

Sous la direction de Benoît Habert.

Soutenue en 2003

à Paris 3 .


  • Résumé

    Cette thèse présente une méthode originale pour identifier et structurer l'information de documents et pour l'interroger. Comme les méthodes linguistiques améliorent les résultats des systèmes actuels, cette approche se base sur des analyses linguistiques et des ressources lexicales. Une analyse grammaticale de haut niveau (morphologique, syntaxique et sémantique) identifie d'abord les éléments d'information et les lie entre eux. Les textes sont analysés à cause du faible contexte des requêtes. Puis le contenu des ressources confère aux informations de nombreuses actualisations grâce à des transformations contextuelles~: synonymie simple et complexe, dérivations avec adaptation du contexte syntaxique, adjonction de traits sémantiques. . . Enfin, l'interrogation des textes a été testée. Une analyse morpho-syntaxique de la question en identifie les éléments d'information et choisit le type de la réponse attendue. Le fragment de texte contenant ces données constitue la réponse à la question.

  • Titre traduit

    Construct and question the informative structure from a French documentary base


  • Résumé

    This thesis presents an original methodology to identify and structure the information of a French textual base in order to question it. Linguistic techniques in current methods makes it possible to improve results. So we propose a methodology using linguistic high-level analysis (morphology, syntax and word sense disambiguation) to identify each piece of information and to connect each of them. The texts are analysed because of the lack of context in queries. Then, the information from lexico-semantic resources is used to transform each piece of information in many realizations: simple and complex synonymy, derivation with adaptation to the syntactic context, addition of semantic features and categories. . . We finally tested an questioning method using a morpho-syntactic analysis to identify each piece of information in the question and to determine the semantic type of the required answer; the passage of text containing these data is the answer to the question.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 276 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 241-251

Où se trouve cette thèse ?

  • Bibliothèque : Université Lumière. Service commun de la documentation. Bibliothèque Chevreul.
  • Non disponible pour le PEB
  • Bibliothèque : Université Sorbonne Nouvelle. Direction des Bibliothèques Universitaires. Section Censier.
  • Consultable sur place dans l'établissement demandeur

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Bibliothèque interuniversitaire de la Sorbonne (Paris).
  • Non disponible pour le PEB
  • Cote : MC 7140
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.