Transfert et généralisation des apprentissages dans un contexte de données imparfaites : Application aux données "Business to Business

par Victor Bouvier

Projet de thèse en Informatique

Sous la direction de CéLINE Hudelot.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Approches interdisciplinaires : fondements, applications et innovation (Palaiseau, Essonne) , en partenariat avec Mathématiques et Informatique pour la Complexité et les Systèmes - EA 4037 (laboratoire) et de CentraleSupélec (2015-....) (établissement de préparation de la thèse) depuis le 01-04-2018 .


  • Résumé

    Dans le cadre d'un apprentissage statistique, le processus de génération de données qui alimentent un algorithme d'apprentissage est extrêmement complexe et inaccessible autrement que par un nombre fini de réalisations. L'écart entre l'échantillon statistique et le processus réel de génération des données peut avoir des conséquences dramatiques sur les performances d'un algorithme et sa capacité à généraliser sur un cas d'usage. Les données relevant du monde industriel, notamment celles issues de l'industrie Business to Business, sont particulièrement sensibles à ce phénomène. En effet, elles sont faible volume, de pauvre qualité et biaisées par de nombreux processus de collection. Bien que les architectures d'apprentissages profonds ont montré leur haut pouvoir de représentation des données, leur haute capacité . Apprendre des représentations résistantes à l'introduction de biais fort dans les données permettrait, dans ce cadre applicatif, d'augmenter le pouvoir de généralisation des algorithmes d'apprentissage statistique

  • Titre traduit

    Transfer learning and generalization from imperfect data : Application to "Business to Business" data


  • Résumé

    A