Thèse soutenue

Traduction assistée par ordinateur et corpus comparables : contributions à la traduction compositionnelle

FR  |  
EN
Auteur / Autrice : Estelle Delpech
Direction : Béatrice DailleEmmanuel Morin
Type : Thèse de doctorat
Discipline(s) : Informatique, Automatique des langues
Date : Soutenance en 2013
Etablissement(s) : Nantes
Partenaire(s) de recherche : autre partenaire : Université de Nantes. Faculté des sciences et des techniques

Résumé

FR

Notre travail concerne l’extraction de lexiques bilingues à partir de corpus comparables, avec une application à la traduction spécialisée. Nous avons d’abord évalué les méthodes classiques d’acquisition de lexiques en corpus comparables (basées l’hypothèse distributionnelle : plus deux termes apparaissent dans des contextes similaires, plus il y a de chances qu’ils soient des traductions) d’un point de vue applicatif. L’ ´évaluation a montré que les traducteurs sont mal à l’aise avec les lexiques extraits : la traduction correcte est trop souvent noyée dans une liste de traductions candidates et ils préfèreraient utiliser un lexique plus petit mais plus précis. Partant de ce constat, nous nous sommes orientés vers une autre approche qui a fait récemment ses preuves pour l’exploitation des corpus comparables et produit des lexiques plus adaptés aux besoins des traducteurs : la traduction compositionnelle (la traduction du terme source est fonction de la traduction de ses parties). Nous nous sommes concentrés sur la traduction d’unités monolexicales : le terme source est découpé en morphèmes, les morphèmes sont traduits puis recomposés en un terme cible. Dans ce cadre, nous avons poursuivi trois axes de recherche : la génération de traductions fertiles (cas où le terme cible contient plus de mots lexicaux que le terme source), l’ind épendance aux structures morphologiques et l’ordonnancement des traductions candidates.