Un cadre unifié pour l'apprentissage multi-vues et multi-cibles: application à la prédiction de défauts dans les semi-conducteurs

par Anastasiia Doinychko

Projet de thèse en Mathématiques et Informatique

Sous la direction de Massih-Reza Amini.

Thèses en préparation à Grenoble Alpes , dans le cadre de École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble) , en partenariat avec Laboratoire d'Informatique de Grenoble (laboratoire) et de AMA (equipe de recherche) depuis le 19-03-2019 .


  • Résumé

    La thèse porte sur le développement d'un nouveau cadre d'apprentissage machine pour des problèmes de prédictions où les observations sont décrites par différents signaux et où elles sont associées à différentes sorties de types différents (par exemple, discrètes et réelles). Jusqu'à présent, deux cadres d'apprentissage distincts avaient été proposés pour l'apprentissage multiview et l'apprentissage multicibles. L'objectif général de la thèse est qu'en résolvant les multiples tâches simultanément et en utilisant les vues corrélées des observations, on pourrait espérer une amélioration en terme de performance des modèles dévelopés suivant ce cadre unifié par rapport aux modèles classiques développés suivant les cadres précédents. Le manque de données étiquetées a été un facteur bloquant dans le développement d'un tel cadre d'apprentissage unifié. Le contexte industriel associé à la thèse et correspondant à la caractérisation des défauts et à l'analyse des défaillances dans les semi-conducteurs facilitera l'acquisition de tels ensembles d'apprentissage. En outre, contrairement aux applications d'apprentissage automatique classiques, où il y a une grande quantité de données; les informations sur les semi-conducteurs ne sont pas générées en quantité suffisante et il faudrait reposer sur des techniques d'exploration de données issues des applications de traitement d'image ou de recherche d'information, et du transfert d'information.

  • Titre traduit

    A Unified Framework for Multiview and Multitarget learning: Application to defect prediction


  • Résumé

    The PhD concerns the development of a new learning framework for observations that are described by different views and for which different predictions of different types (e.g. classification and regression) should be made. Until now, two different frameworks have been developed for multiview learning and multitarget learning. The overall aim of the PhD is that by solving the multiple tasks at once using correlated views of observations, there would be an improvement in terms of models accuracy with respect to classical models developed in the former frameworks. A blocking factor in the development of a unified Multiview and Multitarget learning framework was the lack of labeled data. The industrial context corresponding to defect characterization and failure analysis in semiconductors in which the PhD will take place facilitates the acquisition of such training sets. In addition, unlike typical machine learning applications where a vast amount of data can be gathered, semiconductor and automotive information is not generated in sufficient quantity to rely simply data mining techniques that Image processing or Search applications can utilize, the PhD study will also determine (and preferably) measure the impact that domain knowledge has over data requirements.