Input noise injection for supervised machine learning, with applications on genomic and image data | Theses.fr

Beyrem Khalfaoui

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Injection de bruit pour l'apprentissage automatique supervisé et application sur des données d'images et de génomique

FR |

EN

Auteur / Autrice :	Beyrem Khalfaoui
Direction :	Jean-Philippe Vert
Type :	Thèse de doctorat
Discipline(s) :	Bio-informatique
Date :	Soutenance le 26/09/2019
Etablissement(s) :	Paris Sciences et Lettres (ComUE)
Ecole(s) doctorale(s) :	Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique
Partenaire(s) de recherche :	Laboratoire : Centre de bio-informatique (Fontainebleau, Seine et Marne)
	établissement de préparation de la thèse : École nationale supérieure des mines (Paris ; 1783-....)
Jury :	Président / Présidente : Véronique Stoven
	Examinateurs / Examinatrices : Jean-Philippe Vert, Julien Chiquet
	Rapporteurs / Rapporteuses : Gaël Varoquaux, Julie Josse

Mots clés

FR |

EN

Mots clés contrôlés

Réseaux neuronaux (informatique)

Bioinformatique

Apprentissage profond

Mots clés libres

Apprentissage statistique

Résumé

FR |

EN

Le surapprentissage est un problème général qui affecte les algorithmes d'apprentissage statistique de différentes manières et qui a été approché de différentes façons dans la littérature. Nous illustrons dans un premier temps un cas réel de ce problème dans le cadre d'un travail collaboratif visant à prédire la réponse de patients atteints d'arthrose rhumatoïde à des traitement anti-inflammatoires. Nous nous intéressons ensuite à la méthode d'Injection de bruit dans les données dans sa généralité en tant que méthode de régularisation. Nous donnons une vue d'ensemble de cette méthode, ses applications, intuitions, algorithmes et quelques éléments théoriques dans le contexte de l'apprentissage supervisé. Nous nous concentrons ensuite sur la méthode du dropout introduite dans le contexte d'apprentissage profond et construisons une nouvelle approximation permettant une nouvelle interprétation de cette méthode dans un cadre général. Nous complémentons cette étude par des expériences sur des simulations et des données réelles. Par la suite, nous présentons une généralisation de la méthode d'injection de bruit dans les données inspirée du bruit inhérent à certains types de données permettant en outre une sélection de variables. Nous présentons un nouvel algorithme stochastique pour cette méthode, étudions ses propriétés de régularisation et l'appliquons au context de séquençage ARN de cellules uniques. Enfin, nous présentons une autre généralisation de la méthode d'Injection de bruit où le bruit introduit suit une structure qui est déduite d'une façon adaptative des paramètres du modèle, en tant que la covariance des activations des unités auxquelles elle est appliquée. Nous étudions les propriétés théoriques de cette nouvelle méthode qu'on nomme ASNI pour des modèles linéaires et des réseaux de neurones multi-couches. Nous démontrons enfin que ASNI permet d'améliorer la performance de généralisation des modèles prédictifs tout en améliorant les représentations résultantes.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Injection de bruit pour l'apprentissage automatique supervisé et application sur des données d'images et de génomique

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Injection de bruit pour l'apprentissage automatique supervisé et application sur des données d'images et de génomique

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses