Méthode et outils pour la création automatiques et l'évaluation [i. E automatiques] de structures de bases lexicales multilingues (symétriques) à lexies et axies

par Aree Teeraparbseree

Thèse de doctorat en Informatique

Sous la direction de Christian Boitet et de Gilles Sérasset.

Soutenue en 2005

à l'Université Joseph Fourier (Grenoble) .

    mots clés mots clés


  • Résumé

    Cette thèse aborde le problème de la structuration de bases lexicales multilingues (BDLM) en lexies et axies, à partir de ressources existantes. Ce travail est motivé par l'inadéquation des techniques existantes utilisées isolément, pour la structuration de BDLM. Pour résoudre ce problème, la stratégie proposée est de composer des techniques existantes de désambiguïsation pour structurer semi-automatiquement des bases lexicales multilingues à lexies et acceptions interlingues. De plus, cette thèse propose une catégorisation des critères d'évaluation de la qualité des BDLM, ainsi que les mesures correspondantes. Cette stratégie a été implémentée dans Jeminie, un système logiciel adaptable qui permet d'implémenter à la fois des méthodes de structuration de BDLM et des mesures de qualité, sous la forme de modules logiciels réutilisables. Des compositions arbitraires de ces modules peuvent être définies par un lexicologue dans un langage de haut niveau d'abstraction, ce qui permet d'adapter facilement la structuration et l'évaluation de qualité en fonction des objectifs du lexicologue et des ressources disponibles sans nécessiter de connaissances en programmation. L'intérêt de cette approche a été validé expérimentalement : la qualité des BDLM obtenues est meilleure par combinaison de techniques qu'avec chaque technique antérieure utilisée seule.


  • Pas de résumé disponible.

  • Titre traduit

    Method and tools for the automatic creation and evaluation of structures of (symmetrical) multilingual lexical databases with lexies and axies


  • Résumé

    This thesis studies the problems of structuring multilingual lexical databases (MLDB) from existing resources. This work is motivated by the inadequacy of existing techniques applied separately, for the construction of MLDB. In order solve this problem, the strategy proposed consists in composing existing disambiguation techniques, to semi-automatically build multilingual lexical databases consisting of monolingual and interlingual acceptions. Moreover, this thesis proposes a categorization of the criteria for the qualitative evaluation of MLDB, as well as corresponding measurements. This strategy has been implemented in Jeminie, an adaptable software system which allows to implement both MLDB building methods and qualitative measurements as reusable software modules. Arbitrary compositions of these modules can be defined by a lexicologist in a high-level language, which allows to easily adapt the structuration and evaluation processes according to the objectives of the lexicologist and to the available resources without requiring knowledge in programming. The interest of this approach has been validated in experiments: the quality of obtained MLDB is better than those obtained with each technique separately

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (xii-148 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 141-148

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS05/GRE1/0131
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS05/GRE1/0131/D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.