Injection de bruit pour l'apprentissage automatique supervisé et application sur des données d'images et de génomique.

par Beyrem Khalfaoui

Projet de thèse en Bio-informatique

Sous la direction de Jean-Philippe Vert.

Thèses en préparation à Paris Sciences et Lettres , dans le cadre de Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique , en partenariat avec Centre de Bio-informatique (laboratoire) et de École nationale supérieure des mines (Paris) (établissement de préparation de la thèse) depuis le 01-10-2014 .


  • Résumé

    Après l'étude d'une large littérature sur les différentes manières de rajouter du bruit, aléatoire ou déterministe, dans les données, le modèle ou dans l'algorithme (randomisation), je me suis concentré sur le cas particulier bruit multiplicatif appliqué aux données, de part moins traité que le bruit additive, d'autre pour ses avantages théoriquement prouvés et sa réutilisation récente notamment dans le "dropout". On se concentre sur la compréhension théorique et empirique du rajout de ce bruit ainsi que la création de variantes plus adaptés à certains types de problèmes.

  • Titre traduit

    Input noise injection for supervised machine learning, with applications on genomic and image data.


  • Résumé

    After the study of a large literature on the different noise injection methods (random or deterministic), the focus was on studying multiplicative data noise. This is motivated by some statistical insights, lack of its study in the literature and a notorious algorithm that uses multiplicative model noising called "dropout" that received a lot of attention lately. We focus mainly on understanding the still mysterious simple cases of use of this noising scheme, both theoretically and empirically (simulations), and creating variants more adapted for some types of problems.