Thèse soutenue

Noyaux rationnels et automates d'arbres

FR
Auteur / Autrice : Nadia Sebti
Direction : Djelloul Ziadi
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2015
Etablissement(s) : Rouen
Ecole(s) doctorale(s) : École doctorale sciences physiques mathématiques et de l'information pour l'ingénieur (Saint-Etienne-du-Rouvray, Seine-Maritime ; ....-2016)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...)

Résumé

FR  |  
EN

Dans le cas des mots, un schéma général de calcul des noyaux rationnels a été proposé. Il repose sur un algorithme général de composition des transducteurs pondérés et un algorithme général de calcul de plus petite distances. Notre objectif est de généraliser ce schéma de calcul aux cas des arbres en utilisant les automates d’arbres. Pour ce faire, nous avons fixé les deux objectifs principaux suivants : D’une part, définir les automates d’arbres pour le calcul des noyaux des sousarbres, des sous-séquences d’arbres et des facteurs d’arbres. D’autre part, à partir d’une expression rationnelle d’arbres, construire un automate d’arbres pour le calcul des différents noyaux rationnels décrits par des expressions rationnelles d’arbres en utilisant le schéma suivant sur deux langages d’arbres L1 et L2 : KE (L1;L2) = (AL1 \ AE \ AL2). Nous avons exploré et proposé des algorithmes efficaces pour la conversion d’une expression rationnelle d’arbres en automates d’arbres. Le premier algorithme calcule, à partir d’une expression rationnelle d’arbres E de taille jEj et de largeur alphabétique jjEjj, les ensembles Follow en temps O(jjEjj jEj). Le second algorithme calcule l’automate d’arbres des équations via les k-C-Continuations qui est basé sur la minimisation acyclique de Revuz. Cet algorithme calcule l’automate des équations avec une complexité e temps et en espace en O(jQj jEj) où jQj est le nombre d’états de l’automate produit. Ensuite, nous avons conçu des algorithmes pour le calcul des noyaux des sous-arbres, des sous-séquences d’arbres et des facteurs d’arbres. Notre Approche est basée sur la représentation de l’ensemble d’arbres S = fs1; : : : ; sng (resp. T = ft1; : : : ; tmg) par un automate d’arbres pondéré particulier baptisé Root Automate d’Arbres Pondéré, le RAAP AS (resp. AT ) (équivalent à l’automate des préfixes dans le cas des mots) tel que jASj Pn P i=1 jsij = jSj (resp. JAT j # m j=1 jtj j = jTj) ; puis de calculer les noyaux entre les deux ensembles S et T. Ceci revient au calcul du poids de l’automate intersection AS \ AT. Nous montrons que le calcul du noyau K(S; T) peut se faire en temps et en espace O(jASj jAT j).