Thèse soutenue

Apprentissage de grammaires catégorielles pour simuler l'acquisition du langage naturel à l'aide d'informations sémantiques

FR  |  
EN
Auteur / Autrice : Daniela Dudau
Direction : Rémi GilleronDumitru Todoroi
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2004
Etablissement(s) : Lille 1 en cotutelle avec Université Alexandru Ioan Cuza, Iasi (Roumanie)

Résumé

FR  |  
EN

L'apprentissage automatique du langage naturel reste encore un challenge pour la recherche moderne, d'autant plus que cette tâche nécessite une approche pluridisciplinaire, englobant les sciences cognitives, la linguistique et l'informatique. Cette thèse traite une sous partie de ce vaste domaine, l'acquisition de la syntaxe d'une langue à l'aide de la sémantique, formalisée comme un processus d'inférence grammaticale. La théorie des langages formels, la logique et la théorie de l'apprentissage y apportent leurs contributions en offrant trois modèles formels: les grammaires catégorielles pour représenter la syntaxe, la logique de Montague d'où une sémantique simplifiée est extraite et le modèle d'identification à la limite, par exemples positifs, de Gold, comme support du processus d'inférence. Le choix de ces modèles résulte d'une exploration des études psycholinguistiques et cognitives sur l'acquisition enfantine qui soutiennent les hypothèses suivantes: l'acquisition a lieu en présence d'exemples positifs seuls; il existe des connaissances d'ordre sémantique qui sont innées ou qui peuvent être extraites directement de l'environnement. Nos recherches se sont concentrées sur la classe des grammaires catégorielles dites AB ou classiques qui a donné lieu ces dernières années à des résultats d'apprenabilité au sens de Gold (principalement dus à Kanazawa) intéressants.