Thèse soutenue

Analyse en cadres et rôles sémantiques à base d'apprentissage automatique : amélioration de la généralisation inter-domaine des modèles
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Gabriel Marzinotto
Direction : Frédéric BéchetGéraldine Damnati
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 13/12/2019
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : Ecole Doctorale Mathématiques et Informatique de Marseille (Marseille)
Partenaire(s) de recherche : Laboratoire : Laboratoire d’Informatique et Systèmes (LIS) (Marseille, Toulon)
Jury : Président / Présidente : Alexis Nasr
Examinateurs / Examinatrices : Marie-Hélène Candito
Rapporteurs / Rapporteuses : François Yvon, Christophe Cerisara

Résumé

FR  |  
EN

Rendre les analyseurs sémantiques robustes aux variations lexicales et stylistiques est un véritable défi pour de nombreuses applications industrielles. De nos jours, l'analyse sémantique nécessite de corpus annotés spécifiques à chaque domaine afin de garantir des performances acceptables. Les techniques d'apprenti-ssage par transfert sont largement étudiées et adoptées pour résoudre ce problème de manque de robustesse et la stratégie la plus courante consiste à utiliser des représentations de mots pré-formés. Cependant, les meilleurs analyseurs montrent toujours une dégradation significative des performances lors d'un changement de domaine, mettant en évidence la nécessité de stratégies d'apprentissage par transfert supplémentaires pour atteindre la robustesse. Ce travail propose une nouvelle référence pour étudier le problème de dépendance de domaine dans l'analyse sémantique. Nous utilisons un nouveau corpus annoté pour évaluer les techniques classiques d'apprentissage par transfert et pour proposer et évaluer de nouvelles techniques basées sur les réseaux antagonistes. Toutes ces techniques sont testées sur des analyseurs sémantiques de pointe. Nous affirmons que les approches basées sur les réseaux antagonistes peuvent améliorer les capacités de généralisation des modèles. Nous testons cette hypothèse sur différents schémas de représentation sémantique, langages et corpus, en fournissant des résultats expérimentaux à l'appui de notre hypothèse.