Comprehension automatique de phrases interrogatives francaises et chinoises : application dans le cadre de l'interrogation de bases de donnees

par HUI LAN CHAO

Thèse de doctorat en Linguistique

Sous la direction de Sylviane Cardey-Greenfield.

Soutenue en 1998

à Besançon .


  • Résumé

    Pour faciliter la communication homme-machine, et plus particulierement, l'extraction d'informations a partir des systemes de gestion de bases de donnees (sgbd), notre recherche a pour objectif d'elaborer une interface permettant l'interrogation de bases de donnees en langage naturel. Nous avons avance une methodologie unifiee: non seulement elle permet de traiter deux langues tres eloignees, en l'occurrence le francais et le chinois, mais encore elle reussit a fusionner les deux approches distinctes: l'approche semantique et l'approche syntaxique. Notre analyse automatique des phrases interrogatives mene a la transcription en syntaxe du langage sql en raison de leur rapprochement. Comme sql est un langage de requetes tres repandu dans les sgbd, cette strategie permettra la generalisation de notre interface. Malgre sa convivialite, sql demeure un langage de machine qui est rigide et qui n'admet pas les imprecisions inherentes au langage naturel. Dans les phrases interrogatives visant a extraire des informations a partir d'une base de donnees, les imprecisions proviennent surtout des adjectifs evaluatifs tels que 'bon', 'mauvais', etc. Et de leurs modificateurs comme 'tres', 'plutot', etc. Nous introduisons donc la technique de la logique floue qui consiste a traiter cet aspect problematique de maniere precise. Notre recherche debouche sur la mise en oeuvre du systeme sibdln qui sert d'interface a interroger les bases de donnees en langage naturel. Mais, avant sa mise en service au grand public, l'intervention d'un developpeur est necessaire afin d'etablir, en plus de notre dictionnaire de base, un dictionnaire adapte aux bases de donnees appliquees. Pour cette raison, notre systeme fournit egalement une interface facilitant le travail du developpeur. Ainsi, sibdln est extensible a toutes les bases de donnees.

  • Titre traduit

    Automatic processing of french and chinese interrogative phrases : application in information extraction from databases


  • Résumé

    In view of facilitating the communication between human beings and machines, especially the information extraction from databases, our research aims at elaborating an interface permitting data retrieval in natural language. We propose an unified methodology: not only it enables the processing of two distinct languages, french and chinese, but also it achieves the fusion of two approches, semantic oriented and syntaxic oriented approches. Our automatic analysis of interrogarative phrases leads to the transcription in sql syntaxe with the consideration of their resemblances. Sql is a standard query language, supported by a great many databases management systems. This strategy will facilitate the generalization of our interface. Despite of its friendliness, sql remainds to be a machine language intolerant of imprecisions inherent in natural language. We introduce thus the technique of fuzzy logic to solve this problem. Our researche leads finally to the implementation of a software named sidbln permitting the natural language query of databases.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol., 337 p.
  • Notes : Publication autorisée par le jury
  • Annexes : 78 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque universitaire. Section Lettres.
  • Disponible pour le PEB
  • Cote : 215719
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.