Thèse soutenue

Un environnement générique et ouvert pour le traitement des expressions polylexicales : de l'acquisition aux applications
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Carlos Eduardo Ramisch
Direction : Christian BoitetAline Villavicencio
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 11/09/2012
Etablissement(s) : Grenoble en cotutelle avec Universidade Federal do Rio Grande do Sul (Porto Alegre, Brésil)
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique de Grenoble - Laboratoire d'Informatique de Grenoble
Equipe de recherche : GETALP
Jury : Président / Présidente : Yves Lepage
Examinateurs / Examinatrices : Helena De Medeiros Caseli, Renata Vieira, Rosa Maria Vicari
Rapporteurs / Rapporteuses : Éric Wehrli, Gaël Dias

Résumé

FR  |  
EN

Cette thèse présente un environnement ouvert et souple pour l'acquisition automatique d'expressions multimots (MWE) à partir de corpus textuels monolingues. Cette recherche est motivée par l'importance des MWE pour les applications du TALN. Après avoir brièvement présenté les modules de l'environnement, le mémoire présente des résultats d'évaluation intrinsèque en utilisant deux applications: la lexicographie assistée par ordinateur et la traduction automatique statistique. Ces deux applications peuvent bénéficier de l'acquisition automatique de MWE, et les expressions acquises automatiquement à partir de corpus peuvent à la fois les accélérer et améliorer leur qualité. Les résultats prometteurs de nos expériences nous encouragent à mener des recherches ultérieures sur la façon optimale d'intégrer le traitement des MWE dans ces applications et dans bien d'autres