La coédition langue-UNL pour partager la révision entre langues d'un document multilingue

par Wang-Ju Tsai

Thèse de doctorat en Informatique

Sous la direction de Christian Boitet.

Soutenue en 2004

à l'Université Joseph Fourier (Grenoble) .

    mots clés mots clés


  • Résumé

    Etant donnée la demande croissante en communication multiligue, il est de plus en plus nécessaire de créer et de maintenir des documents multilingues, pour les entreprises internationales comme pour les internautes. Pourtant, le problème principal reste le coût de traduction et de révision d'un document multilingue croît linéairement en fonction du nombre de langues. Pour le résoudre, nous proposons de produire ces documents multilingues par traduction automatique (TA), de partager le travail de révision entre les langues, et de réviser incrémentalement, à la demande et en mode coopératif. Notre solution est fondée sur l'utilisation d'un système de TA à "pivot", et reprend l'idée de "coédition" utilisée dans certains systèmes de génération multilingue. Pour des raisons développées en détail, UNL (Universal Networking Language) semble le meilleur langage pivot pour un tel système. Dans notre approche, l'utilisateur peut non seulement éditer directement le texte, mais aussi "coéditer" le graphe à travers le texte. Pour cela, une heuristique construit automatiquement une correspondance fine entre le texte et le graphe UNL en n'utilisant que des ressources disponibles gratuitement pour beaucoup de langues (segmenteurs, lemmatiseurs, dictionnaires). Pour chaque fragment de texte ainsi relié au graphe, on peut construire un menu dont chaque item est formé d'une annotation dans le texte et d'una action sur le graphe. Le graphe modifié peut être ensuite déconverti dans plusieurs langues, qui bénéficient toutes des corrections effectuées. Une maquette permet de démontrer un scénario dans lequel l'utilisateur alterne entre lecture (monolingue) et coédition.


  • Pas de résumé disponible.

  • Titre traduit

    The coedition text-UNL for sharing the postedition among languages in a multilingual document


  • Résumé

    As the demand for multilingual communication increases, the need to generate and to maintain multlilingua documents becomes more and more important, for both international firms and ordinary Internet users. However, the main problem remains : the cost of translation and postediting of multilingual documents increase linearly with the number of the languages involved. To solve this problem, we propose to produce multilingual documents by machine translation (MT), to share the task of revision among languages, and to postedit incrementally on demand and in cooperative mode. Our solution is based on using a "pivot" MT system, and building on the idea of the "co-edition" as used in some multilingual generation systems. As detailed in the thesis, UNL (Universal Networking Language) seems to be the best pivot language for such a system. Users can not only directly edit the text, but also "co-edit" the graph trough the text. In order to achieve this, a heuristic method is proposed to construct automatically a fine-grained correspondence between the text and the UNL graph by using only freely available resources for many languages (segmenters, lemmatisers, and dictionaries). For each segment of the text linked to the graph in this way, we can construct a menu, in wich each item consists of an annotation of the text and an action on the graph. The modified graph can then be deconverted into several languages, all of which benefit from corrections. A prototype demonstrates a scenario where the user switches between reading mode (monolingual) and co-editing mode.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : xvii-310 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.267-282

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS04/GRE1/0091
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS04/GRE1/0091/D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.