Structures et algorithmes pour la traduction fondee sur la memoire

par EMMANUEL PLANAS

Thèse de doctorat en Sciences appliquées

Sous la direction de Christian Boitet.

Soutenue en 1998

à Grenoble 1 .

    mots clés mots clés


  • Résumé

    Cette etude concerne les outils d'aide a la traduction fondee sur la memoire (otfm). La premiere partie offre un etat de l'art de ces outils. Il est ensuite explique comment les otfm de premiere generation, tres utiles a l'industrie de la traduction, ne permettent toutefois pas de realiser correctement certaines operations basiques. On demontre alors que de ces faiblesses proviennent principalement du type de representation des donnees, interne aux otfm. Deux representations complementaires sont alors proposees : une representation primaire fondee sur xml ou les donnees sont sequentielles, et une forme analytique composee d'un etagement de treillis lies : la structure telam. Celle-ci permet d'eclater les donnees selon leur nature en autant de treillis. Cette seconde partie se termine par la presentation d'un modele abstrait pour telam, appele tela. Une representation objet d'une part et fondee sur le formalisme xml d'autre part, sont proposees pour tela. La troisieme partie propose des algorithmes pour manipuler les structures telam, et evalue leurs complexites statiques et dynamiques. La notion de similitude est proposee pour calculer les proximites de deux segments de traduction par le nombre d'operations d'edition elementaires necessaires pour passer de l'un a l'autre. Ces operations s'appliquent sur chacun des etages des structures telam representant chacun des segments. Deux algorithmes sont proposes a partir des travaux de wagner et fisher (1974) : l'algorithme x' pour evaluer la distance d'edition entre deux segments, et l'algorithme y' pour donner l'une des suites d'operations elementaires qui font passer de l'un a l'autre. On montre alors comment utiliser les structures telam et les algorithmes x' et y' pour realiser un nouveau systeme de traduction fondee sur la memoire capable d'adapter et composer les unites de traduction. En outre, il devient alors possible de transferer les objets non textuels et la mise en forme depuis le segment d'entree vers sa traduction.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 377 P.
  • Annexes : 161 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.