Deep learning models and algorithms for sequential data problems : applications to language modelling and uncertainty quantification | Theses.fr

Alice Martin

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Modèles et algorithmes d’apprentissage profond pour de la donnée séquentielle : applications aux modèles de langage et à la quantification d’incertitude

FR |

EN

Auteur / Autrice :	Alice Martin
Direction :	Sylvain Le Corff
Type :	Thèse de doctorat
Discipline(s) :	Mathématiques appliquées
Date :	Soutenance le 14/06/2022
Etablissement(s) :	Institut polytechnique de Paris
Ecole(s) doctorale(s) :	École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche :	Etablissement opérateur d'inscription : Télécom SudParis (France)
	Laboratoire : Institut polytechnique de Paris (2019-....) - Communications, Images et Traitement de l'Information / CITI - Traitement de l'Information Pour Images et Communications / TIPIC-SAMOVAR
Jury :	Président / Présidente : François Desbouvries
	Examinateurs / Examinatrices : Pierre Pudlo, François Septier, Laure Soulier, Olivier Pietquin
	Rapporteurs / Rapporteuses : Pierre Pudlo, François Septier

Mots clés

FR |

EN

Mots clés contrôlés

Traitement automatique du langage naturel

Algorithmes

Monte-Carlo, Méthode de

Intelligence artificielle

Mots clés libres

Modèles génératifs profonds

Méthodes de Monte Carlo séquentielles

Lissage en ligne

Modèles de langage

Apprentissage par renforcement

Quantification d'incertitude

Algorithme

Résumé

FR |

EN

Dans ce manuscrit de thèse, nous développons de nouveaux algorithmes et modèles pour résoudre les problèmes d'apprentissage profond sur de la donnée séquentielle, en partant des problématiques posées par l'apprentissage des modèles de langage basés sur des réseaux de neurones. Un premier axe de recherche développe de nouveaux modèles génératifs profonds basés sur des méthodes de Monte Carlo Séquentielles (SMC), qui permettent de mieux modéliser la diversité du langage, ou de mieux quantifier l'incertitude pour des problèmes de régression séquentiels. Un deuxième axe de recherche vise à faciliter l'utilisation de techniques de SMC dans le cadre de l'apprentissage profond, en développant un nouvel algorithme de lissage à coût computationnel largement réduit, et qui s'applique à un scope plus large de modèles à espace d'états, notamment aux modèles génératifs profonds. Finalement, un troisième axe de recherche propose le premier algorithme d'apprentissage par renforcement permettant d'apprendre des modèles de langage conditionnels "ex-nihilo" (i.e sans jeu de données supervisé), basé sur un mécanisme de troncation de l'espace d'actions par un modèle de langage pré-entrainé.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Modèles et algorithmes d’apprentissage profond pour de la donnée séquentielle : applications aux modèles de langage et à la quantification d’incertitude

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Modèles et algorithmes d’apprentissage profond pour de la donnée séquentielle : applications aux modèles de langage et à la quantification d’incertitude

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses