Analyse des performances de l'apprentissage automatique: une approche à la frontière entre matrices aléatoires et physique statistique, et application au traitement de la parole

par Lorenzo Dall'Amico

Projet de thèse en Signal image parole telecoms

Sous la direction de Romain Couillet, Thomas Hueber et de Nicolas Tremblay.

Thèses en préparation à Grenoble Alpes , dans le cadre de École doctorale électronique, électrotechnique, automatique, traitement du signal (Grenoble) , en partenariat avec Grenoble Images Parole Signal Automatique (laboratoire) depuis le 31-08-2018 .


  • Résumé

    La récente montée en puissance du regain d'intérêt pour les applications d'apprentissage automatique, stimulée par le big data révolution, a fourni de nombreuses méthodes modernes puissantes pour l'extraction automatisée de l'information et apprentissage automatique Ces méthodes sont cependant intrinsèquement enracinées dans un complexe (non linéaire) représentations des données (les soi-disant caractéristiques) qui défient fortement toute tentative profonde compréhension théorique de leur comportement. Alors que ces méthodes témoignent généralement performances (comme dans le cas des réseaux de neurones profonds) et sont apparemment applicables à une grande gamme d'applications modernes (en reconnaissance de formes et de la parole notamment), dans des disciplines critiques comme dans des contextes militaires ou médicaux, ce manque de garanties théoriques, de limites de performance, les comparaisons avec l'optimalité, etc., peuvent être clairement inacceptables . En tant que tel, après le puissant s'efforcer d'appliquer l'apprentissage en profondeur à un large éventail de problèmes d'ingénierie, une demande irrésistible a récemment émergé pour une meilleure compréhension de ces outils d'apprentissage machine avancés .

  • Titre traduit

    Harnessing Machine Learning Performances: a random matrix and statistical physics approach, with applications to speech processing


  • Résumé

    The recent surge of renewed interest for machine learning applications, spurred by the big data revolution, has provided numerous powerful modern methods for automated information mining and machine learning. These methods are however inherently rooted in complex (non linear) representations of the data (the so-called features) which strongly challenge any tentative profound theoretical understanding of their behavior. While those methods usually evidence high performances (such as in the case of deep neural networks) and are seemingly applicable to a large range of modern applications (in pattern and speech recognition notably), in critical disciplines such as in military or medical contexts, this lack of theoretical guarantees, performance bounds, comparisons to optimalility, etc., may be plainly inacceptable. As such, after the powerful endeavor for applying deep learning to a wide range of engineering problems, a compelling demand has lately emerged for a better understanding of these advanced machine learning tools.