Constitution et exploitation de bi-textes pour l'Aide à la traduction

par Olivier Kraif

Thèse de doctorat en Linguistique

Sous la direction de Henri Zinglé.

Soutenue en 2001

à Nice .


  • Résumé

    La présente étude est centrée sur les problèmes liés à la constitution des corpus bi-textuels et à leur exploitation pour l'aide à la traduction. D'abord, nous distinguons la traduction en tant qu'activité de communication du simple transcodage, impliquant le transfert des unités et des structures d'une langue vers une autre. Ainsi nous montrons que la traduction est une affaire d'interprétation. Nous examinons les problèmes découlant des divergences entre les organisations lexicales et grammaticales des deux langues, et montrons qu'il est difficile d'aboutir à des systèmes de transformation généraux dès lors qu'on intégre les phénomènes idiomatiques. Nous en tirons la notion d'unité de traduction, cristallisant différents types de phénomènes contrastifs. La deuxième partie est consacrée à l'alignement phrastique, visant à la constitution automatique de bi-textes. Nous développons les techniques les plus répandues et les mieux éprouvées, tant du point de vue des indices que des algorithmes. Par un travail empirique, nous montrons comment articuler ces techniques de façon optimale sur la base d'une heuristique simple. Enfin nous abordons les problèmes de l'alignement au niveau lexical. Nous montrons que le critère de compositionnalité traductionnelle au niveau des mots ne permet pas d'extraire des couples cohérents, tant du point de vue de la segmentation qu'au niveau de l'équivalence des segments appariés. Nous introduisons le concept de correspondance lexicale, désignant l'appariement d'unités prédéfinies au niveau contrastif, et dont le transfert est considéré comme facultatif. Nous montrons empiriquement comment ces correspondances peuvent être extraites à partir d'indices adaptés et d'algorithmes simples. Les bi-textes apparaissent comme des gisements d'informations contrastives, dont les outils d'observation statistique permettent d'extraire les régularités, les équivalences générales émergeant à travers la masse des traductions particulières.

  • Titre traduit

    Aligning for machine-aided translation


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : [677] p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.DCXLVII-DCLXVII

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Bibliothèque Lettres, Arts, Sciences humaines-Henri Bosco.
  • Non disponible pour le PEB
  • Cote : 2001NICE2018
  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Bibliothèque Lettres, Arts, Sciences humaines-Henri Bosco.
  • Disponible pour le PEB
  • Cote : 2001NICE2018
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.