Thèse soutenue

Contribution a l'etude de l'appariement de textes bilingues et monolingues

FR  |  
EN
Auteur / Autrice : ADNANE ZRIBI
Direction : Fathi Debili
Type : Thèse de doctorat
Discipline(s) : Sciences biologiques et fondamentales appliquées. Psychologie
Date : Soutenance en 1995
Etablissement(s) : Paris 11

Résumé

FR

Nous abordons le probleme de l'appariement des phrases et des mots de paires de textes bilingues ou monolingues. L'appariement bilingue pose le probleme de la reconnaissance de la traduction, l'appariement monolingue celui de la reconnaissance de la paraphrase. L'appariement des phrases se fonde sur l'appariement des mots qui les composent. Nous montrons que, meme partiel et entache d'erreurs, celui-ci peut conduire a un bon appariement des phrases. La solution preconisee pour les deux appariements se fonde sur une meme architecture algorithmique. L'appariement des mots est construit a partir d'un rapprochement lexico-morphologique. Il utilise pour l'essentiel des dictionnaires de transfert dans le cas de paires de textes bilingues, et des dictionnaires de synonymes dans le cas de paires de textes monolingues. Les textes apparies ne sont soumis qu'a une simple analyse morphologique. La lemmatisation est etablie de facon dynamique durant le processus d'appariement. Une etude manuelle de l'appariement a ete conduite dans deux perspectives: l'evaluation des performances d'une part et la definition des principes algorithmiques d'autre part (limitations, types des appariements a construire, nature des connaissances a mettre en uvre). En conclusion, nous retenons la difficulte du probleme souleve. Difficulte disons-nous car le probleme de l'appariement reste finalement ouvert dans plusieurs directions (groupes de mots, morphemes, etc. ), et que, d'une facon generale, criteres et tests linguistiques restent a elaborer si l'on veut en faire une operation aisement reproductible