2012-10-24T07:22:07Z
2023-11-09T07:39:45Z
Un environnement générique et ouvert pour le traitement des expressions polylexicales : de l'acquisition aux applications
2012
2012-09-11
Electronic Thesis or
Dissertation
text
Text
electronic
Cette thèse présente un environnement ouvert et souple pour l'acquisition automatique d'expressions multimots (MWE) à partir de corpus textuels monolingues. Cette recherche est motivée par l'importance des MWE pour les applications du TALN. Après avoir brièvement présenté les modules de l'environnement, le mémoire présente des résultats d'évaluation intrinsèque en utilisant deux applications: la lexicographie assistée par ordinateur et la traduction automatique statistique. Ces deux applications peuvent bénéficier de l'acquisition automatique de MWE, et les expressions acquises automatiquement à partir de corpus peuvent à la fois les accélérer et améliorer leur qualité. Les résultats prometteurs de nos expériences nous encouragent à mener des recherches ultérieures sur la façon optimale d'intégrer le traitement des MWE dans ces applications et dans bien d'autres
This thesis presents an open and flexible methodological framework for the automatic acquisition of multiword expressions (MWEs) from monolingual textual corpora. This research is motivated by the importance of MWEs for NLP applications. After briefly presenting the modules of the framework, the work reports extrinsic evaluation results considering two applications: computer-aided lexicography and statistical machine translation. Both applications can benefit from automatic MWE acquisition and the expressions acquired automatically from corpora can both speed up and improve their quality. The promising results of our experiments encourage further investigation about the optimal way to integrate MWE treatment into these and many other applications.
Traitement automatique des langues
Linguistique computationnelle
Expressions multimots
Acquisition lexicale
Traduction automatique
Lexicographie
Natural language processing
Computational linguistics
Multiword expressions
Lexical acquisition
Machine translation
Lexicography
Ramisch, Carlos Eduardo
Boitet, Christian
Villavicencio, Aline
Grenoble
Universidade Federal do Rio Grande do Sul (Porto Alegre, Brésil)
École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Laboratoire d'Informatique de Grenoble
GETALP
Laboratoire d'Informatique de Grenoble
http://www.theses.fr/2012GRENM059/document