Thèse soutenue

Méthodes spectrales pour l'inférence grammaticale probabiliste de langages stochastiques rationnels

FR
Auteur / Autrice : Raphaël Bailly
Direction : François Denis
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 12/12/2011
Etablissement(s) : Aix-Marseille 1
Ecole(s) doctorale(s) : Ecole doctorale Mathématiques et Informatique de Marseille (Marseille ; 1994-....)
Jury : Président / Présidente : Rémi Gilleron
Examinateurs / Examinatrices : François Denis, Colin de La Higuera, Amaury Habrard, Jean-Christophe Janodet
Rapporteurs / Rapporteuses : Alexander Clark, Jose Oncina

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Nous nous plaçons dans le cadre de l’inférence grammaticale probabiliste. Il s’agit, étant donnée une distribution p sur un ensemble de chaînes S∗ inconnue, d’inférer un modèle probabiliste pour p à partir d’un échantillon fini S d’observations supposé i.i.d. selon p. L’inférence gram- maticale se concentre avant tout sur la structure du modèle, et la convergence de l’estimation des paramètres. Les modèles probabilistes dont il sera question ici sont les automates pondérés, ou WA. Les fonctions qu’ils modélisent sont appelées séries rationnelles. Dans un premier temps, nous étudierons la possibilité de trouver un critère de convergence absolue pour de telles séries. Par la suite, nous introduirons un type d’algorithme pour l’inférence de distributions rationnelles (i.e. distributions modélisées par un WA), basé sur des méthodes spectrales. Nous montrerons comment adapter cet algorithme pour l’appliquer au domaine, assez proche, des distributions sur les arbres. Enfin, nous tenterons d’utiliser cet algorithme d’inférence dans un contexte plus statistique d’estimation de densité.