Projection interlingue d'annotations linguistiques à partir de corpus parallèles et comparables

par Othman Zennaki

Projet de thèse en Informatique

Sous la direction de Laurent Besacier et de Nasredine Semmar.

Thèses en préparation à Grenoble Alpes , dans le cadre de École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble) , en partenariat avec Laboratoire d'Informatique de Grenoble (laboratoire) et de GETALP - Groupe d'Etude en Traduction/Traitement des Langues et de la Parole (ancien labo Clips) (equipe de recherche) depuis le 05-03-2014 .


  • Résumé

    Ma thèse se situe dans le contexte de l'automatisation du processus de construction de ressources linguistiques multilingues annotées par projection interlingue. L'objectif est d'identifier des équivalences terminologiques, morpho-syntaxiques, syntaxiques ou sémantiques à partir de corpus de textes parallèles ou comparables. Deux processus constituent un prérequis pour la projection interlingue d'annotations à partir de corpus : un alignement au niveau des paragraphes, des phrases ou d'unités lexicales de taille variable, et une analyse linguistique pour l'annotation des textes en langue source.

  • Titre traduit

    Cross-language projection of linguistic annotations using parallel and comparable corpora


  • Résumé

    My thesis falls within the scope of automating the process of building annotated multilingual linguistic resources and tools. The main purpose in this process is to identify lexical, syntactical and semantic equivalences across parallel or comparable corpora.