Thèse de doctorat en Études tchèques. Traitement automatique des langues
Sous la direction de Patrice Pognan et de Eva Hajičová.
Soutenue en 2008
à Paris, INALCO .
L'objet de cette thèse est l'analyse automatique des erreurs commises par des apprenants francophones dans des exercices de déclinaison du tchèque. Notre travail présente la conception et la réalisation d'une plateforme d'enseignement assisté par ordinateur CETLEF, mettant en ligne des exercices à trous et permettant un retour sur les erreurs commises. Ce dispositif peut servir également à la collecte du productions d'apprenants pour une recherche en acquisition par analyse des erreurs, CETLEF, composée d'une base de données relationnelle et d'interfaces auteur et apprenant, a nécessité la définition d'un modèle de la déclinaison du tchèque. Ce modèle contient un classement détaillé des types paradigmatiques et des règles pour la réalisation des alternances vocaliques et consonantiques. Il est employé pour l'annotation morphologique des formes requises, pour la présentation du système morphologique du tchèque sur la plateforme apprenant, ainsi que la réalisation de la procédure de diagnostic automatique des erreurs. Le diagnostic est effectué par comparaison d'une production erronée avec des formes hypothétiques générées à partir du radical de la forme requise et des différentes désinences casuelles. Si une correspondance est trouvée, l'erreur est interprétée d'après les différences dans les traits morphologiques de la forme requise et de la forme hypothétique. L'évaluation du diagnostic des productions recueillies sur CETLEF montre que la grande majorité des erreurs peut être interprétée par cette technique.
Acquisition of Czech by French learners : automatic analysis of errors in declension
Pas de résumé disponible.
The object of this thesis is the automatic analysis of errors made by French-speaking learners in declension exercices in Czech. Our work presents the conception and realization of a platform of computer-assisted language learing CETLEF, featuring on-line fill-in-the-blank exercices with feedback on errors. This device can also be useful in the collection of learner production samples in the context of research into second langauge acquisition via error analysis. CETLEF, consisting of a relational data base and author and learner interfaces, rendered necessary the definition of a model for declension in Czech. This model contains a detailed classification of the paradigms and rules for the realization of vocalic and consonantal alternations. It enables the morphological annotation of required forms, the didactic presentation of the morphological system of Czech on the learning platform, as well as the realization of a procedure of automatic error diagnosis. Diagnosis is carried out by the comparison of an erroneous production with hypothetical forms generated from the radical of the required form and various haphazard endings. If a correspondence is found, the error is interpreted according to the differences in the morphological features of the required form and the hypothetical form. An appraisal of the diagnosis of the productions collected on CETLEF shows that the vast majority of errors can be interpreted with the aid of this technique.