Apprentissage machine en conception et fabrication à partir de jeux de données réduits ou incertains

par Romaric Prod'Hon

Projet de thèse en GI : Génie Industriel : conception et production

Sous la direction de Henri Paris.

Thèses en préparation à l'Université Grenoble Alpes en cotutelle avec l'Université de Tampere , dans le cadre de École doctorale Ingénierie - matériaux mécanique énergétique environnement procédés production , en partenariat avec Laboratoire des Sciences pour la Conception, l'Optimisation et la Production de Grenoble (laboratoire) et de Conception Produit Process (CPP) (equipe de recherche) depuis le 01-09-2020 .


  • Résumé

    L'apprentissage machine (Machine Learning) est actuellement utilisé et testé dans de nombreux secteurs. L'utilisation de telles méthodes présente un intérêt évident pour la conception et la fabrication. Des applications intéressantes de ces approches lors du processus de conception et de fabrication concernent la prise de décision pour un choix de technologie de fabrication, une optimisation des paramètres de conception et de fabrication ou encore un suivi dynamique du processus de fabrication. Malheureusement, plusieurs barrières rendent difficiles leurs utilisations dans ces domaines spécifiques. En effet, le Machine Learning dans les approches actuellement médiatisées (apprentissage profond, réseaux convolutifs) nécessite l'utilisation d'un grand nombre de données pour entraîner les modèles . En conception et fabrication, la collecte d'une quantité suffisante de données est une opération parfois impossible, surtout lors des phases de préconception où la pièce et le produit n'existent pas encore. Par ailleurs, si la collecte de données est possible pour certaines phases du processus, les modèles entrainés sont souvent spécifiques à certaines technologies ou géométries. Par conséquent, ils sont difficilement généralisables. Deux problématiques de recherche émergent de ces contraintes inhérentes au processus de conception et de fabrication : Comment entraîner des modèles d'intelligence artificielle lorsque les données d'entraînement sont en faible quantité, incomplètes, éparses ou entachées d'erreurs ? Plus spécifiquement, comment se rapprocher des performances cognitives humaines pour apprendre à partir d'un nombre de cas réduits dans le domaine de la fabrication ? Répondre à ces questions est essentielle pour permettre une application du Machine Learning aux secteurs de la conception et de la fabrication. Résoudre ces problèmes permettrait de disposer de modèles d'apprentissage pour la conception et la fabrication capables de généraliser. La prise de décisions concernant la conception, la technologie utilisée et la méthode de fabrication ainsi que l'optimisation dynamique des paramètres de fabrication sont des applications innovantes envisagées. Au cours de cette thèse, plusieurs pistes de recherche seront explorées. Toutes ces pistes considèrent le méta-apprentissage qui vise à se rapprocher des performances de l'apprentissage humain. La combinaison d'un travail de développement de métriques, de modèles et de méthodes d'optimisations constitue la base de la stratégie de recherche. Des métriques métiers capables de synthétiser la connaissance en conception et fabrication seront utilisées en s'appuyant sur la méthode DACM, une méthode de métamodélisation développée par l'université de Tampere. Cette méthode permet de créer un graphe causal qui représente un processus via une représentation graphique des liens de causes à effets entre les variables du problème considéré. La méthode DACM a été développée au cours d'une thèse en cotutelle précédente entre l'université Grenoble Alpes et l'université de Tampere. L'exploitation de ces précédents travaux est possible au travers des réseaux Bayésiens qui peuvent être vus comme l'étape qui suit la génération de graphes causaux . Ces réseaux Bayésiens permettent d'intégrer et découvrir de nouvelles corrélations et apportent une vision statistique du modèle causal. Une autre approche vise à encoder et exploiter la connaissance latente en combinant les méthodes à base de factorisations de matrices, de type Singular Value Decomposition (SVD) avec des approches de recherche de similarités de voisins appelées méthode de recherche de « neighbourhood » . Ces approches sont utilisées en traitement du signal, mais aussi dans les systèmes de recommandation ou dans les systèmes d'analyse du langage. Ces méthodes ont démontré leurs performances dans les concours annuels organisés par Netflix. Une première preuve de concept a été déjà réalisée dans le cadre de la collaboration UGA / Tampere et vient d'être soumise en journal. Durant la thèse en cotutelle, l'objectif est d'explorer ces différentes approches pour des applications de prise de décision, de choix de paramètres optimaux de fabrication et conception et éventuellement si les progrès le permettent de contrôle en phase de fabrication. Un plan ambitieux de publications en journal et conférences dans les domaines de la fabrication et de la conception mais aussi de l'informatique est prévu. La thèse en cotutelle devrait être réalisée par compilation d'articles de journaux (4 minimum).

  • Titre traduit

    Machine Learning in design and manufacturing using reduced and uncertain datasets


  • Résumé

    Machine Learning is widely utilized and tested in several fields. Such approaches show obvious potential for application in design and manufacturing. Prospective needs of such methods imply decision-making for manufacturing technology, optimization of design and manufacturing parameters as well as dynamic control of the manufacturing process. However, several challenging issues remain open in order to apply these techniques in those specific fields. Indeed, Machine Learning and other popular approaches (deep learning, convolutional neural networks) do require an extensive number of data to train the models. In design and manufacturing, efficient data collection is often impossible, especially in the early design steps where both part and product do not exist. Furthermore, even if the data collection is feasible, such models are usually trained for specific technologies and geometries. Hence, the generalization capability is limited for such type of models. Two problems arise from the inherent constraints of design and manufacturing processes: How to efficiently train artificial intelligence models when the training data are in small quantities, uncertain and scattered? More specifically, how to develop Machine Learning methods approaching draw near the human capabilities by using small number of cases in the design and manufacturing field? Answering these two questions is fundamental to apply Machine Learning in design and manufacturing. Solving these two research issues would lead to machine learning models embedding generalization capability for the design and manufacturing fields. Prospective and innovant applications would emerge naturally and include decision-taking process, dynamic optimization of process parameters and dynamic control. During this PhD thesis, several potential solutions will be explored. All of them considering meta-learning as a basis, with the aim to approach human performances in learning. One pillar of the research strategy will be the development of specialized metrics, models and optimization methods. Domain-based metrics able to grasp the knowledge in design and manufacturing will be utilized and can use the DACM method, a metamodeling approach developed by Tampere University. This method creates causal graphs as graphical representations of cause-effects relationships between the variables of the problem. DACM has been previously developed in a joint PhD thesis between Grenoble Alpes University and Tampere University. Potential utilization is envisioned through Bayesian Networks which can be considered as the following step after a causal graph generation. They allow to integrate and discover new correlations and provide a statistical representation of the causal model. Another approach aims at encoding the latent knowledge by combining matrixes factorization-based methods such as Singular Value Decomposition (SVD) with neighborhood similarities research methods. Signal processing, recommender systems and natural language processing make extensive use of these techniques. They already repeatedly proved their performances in the Netflix annual competition. Grenoble Alpes university and Tampere University have conjointly developed and submitted a proof of concept using this approach and submitted in journal. During the joint PhD thesis, the goal is to explore these different approaches for applications in decision-making process, optimal selection of design and process parameters and dynamic control in manufacturing process. An ambitious publication plan in journals and conferences in the fields of design and manufacturing as well in informatics is planned. The joint PhD thesis is in form of a compilation of journal articles (four minimum).