Optimisation multi-objectif et apprentissage artificiel pour l'entraînement sportif : de la performance à la santé

par Rayane Elimam

Projet de thèse en Informatique

Sous la direction de Jacky Montmain et de Stéphane Perrey.

Thèses en préparation à l'IMT Mines Alès , dans le cadre de École Doctorale Information, Structures, Systèmes , en partenariat avec EuroMov Digital Health in Motion (laboratoire) et de I3A - Informatique, image, intelligence artificielle (equipe de recherche) depuis le 01-12-2019 .


  • Résumé

    L'enjeu des sports de compétition professionnels est de plus en plus grandissant ; proportionnel aux investissements pharamineux dans certains sports comme le football, par exemple. Par conséquent, toutes les décisions dans ces domaines doivent être optimisées, qu'il s'agisse du choix de l'entraineur, du préparateur physique, des stratégies d'amélioration de la performance des joueurs, ou encore de la prévention des blessures. Dans cette thèse, nous nous focalisons sur la gestion des entrainements des joueurs dans le but de maximiser leurs performances et de prévenir leurs blessures. La « science » de l'entraînement est perçue comme une science appliquée et intégrée, développant des approches et mesures de terrain sur la base de méthodes scientifiques éprouvées issues des sciences du mouvement humain. Dans le contexte des sports de compétition, les questions de recherche sont habituellement adressées dans des environnements complexes, où les interrelations entre les différentes variables présentent la plupart du temps un caractère non-linéaire (Perl, 2001). L'analyse et la compréhension des processus d'entraînement, c'est-à-dire l'effet de la charge d'entraînement sur la performance sportive a pour objectif d'aider l'encadrement technique (entraîneur, préparateurs physiques) dans les sports d'élite. En effet, la performance sportive est multifactorielle et est étroitement liée aux adaptations psycho-physiologiques induites par le programme d'entraînement. Ces adaptations biologiques correspondraient à des phénomènes complexes non linéaires (Philippaerts et al., 2008). On peut distinguer deux types de charges d'entrainement chez un athlète. La charge d'entraînement externe qui peut être définie comme le travail accompli par l'athlète et mesuré indépendamment de ses caractéristiques internes(e.g., durée, vitesse, accélération, distance parcourue, etc.). La charge interne éprouvée par un athlète peut, elle, être définie comme la somme des stimuli physiologiques et psychologiques−le stress imposé−pendant les activités d'entraînement (Impelizzeri et al., 2005), e.g., la perception de la difficulté de l'effort. Les recherches les plus récentes sont principalement dominées par des études de détermination de la charge externe via l'accessibilité de différents systèmes de mesure (GPS, centrales inertielles) qui peuvent être portés par les athlètes à l'entraînement et / ou en compétition. Cependant, il demeure un manque d'approches de détermination de la charge interne autre que la perception de la difficulté de l'effort, probablement en raison de la difficulté des mesures nécessaires actuellement disponibles pour quantifier les aspects de la charge interne. La capacité à quantifier la charge interne est d'une importance première car elle permet aux entraîneurs de dévoiler les implications de la charge externe et la mise en place des méthodes d'entraînement subséquentes sans effets délétères. Force est de constater que les travaux contemporains sont basés généralement sur une approche réductionniste, en examinant principalement les dimensions de la fatigue physique reliées à l'expression de la charge externe avec une prise en compte très limitée des réponses cognitivo motrices et mentales, bien que la plupart des activités sportives (sports collectifs notamment) soit basée sur des capacités de concentration soutenue, de perception et de prise de décision. Considérant le potentiel grandissant des techniques de neuroimagerie portables à fournir plus d'informations sur les impacts de séances d'entraînement spécifiques sur les fonctions cérébrales (Cheron et al., 2016), la quantification de la charge interne pourrait être enrichie dans différents sports. Malgré des preuves solides d'hétérogénéité dans la réponse à l'entraînement, les études examinant la relation entre les mesures internes et externes de la charge d'entraînement dans les sports d'équipe ont utilisé des approches d'analyse linéaire telles que la régression multiple (Thorpe et al., 2015). Les méthodes à base d'apprentissage automatique ont connu une popularité croissante, avec des applications telles que la prédiction des résultats de la compétition (Pfeiffer et Hohmann, 2012) et la quantification des types d'activité de mouvement (De Vries et al., 2011). Ces approches ont la capacité à tenir compte de la non-linéarité dans les ensembles de données et donc à améliorer les performances des différents modèles de prédiction préexistants (Edelman-Nusser et al., 2002). Par conséquent, la mise en œuvre de telles approches pourrait aider à mieux comprendre la charge d'entraînement à un niveau individuel, augmentant ainsi notre compréhension de la ou les relation(s) entre charges interne et externe afin de prescrire et contrôler la charge d'entraînement. Des travaux récents montrent également l'intérêt et l'apport des méthodes d'aide à la décision multicritère dans l'évaluation de la performance des sportifs et la prévention des blessures (Bourdon et al., 2017 ; Blanco et al., 2018). L'identification du modèle exprimant la relation entre les charges internes et externes des entrainements doit permettre de mieux choisir l'opérateur d'agrégation qui évaluera la forme globale d'un athlète. En effet, l'évaluation de sa performance globale sera basée sur l'ensemble des mesures objectives et subjectives des réponses associées aux charges d'entrainement. Des travaux récents dans le domaine de l'optimisation multi objectif montrent comment guider l'entraineur pour des stratégies d'entrainement plus pertinentes (Montmain et al, 2015). Dans cette thèse croisant les regards issus des sciences du numérique et du mouvement humain, nous proposons de mettre en œuvre les dernières connaissances en matière d'optimisation multi objectif et de traitement de données par apprentissage afin d'une part (i) de rechercher les marqueurs numériques des adaptations des personnes en situation de stress marqué induit par l'entraînement afin de prévenir les risques pour la santé et la blessure, puis d'autre part (ii) de modéliser le processus de décision afin de définir la meilleure stratégie d'entrainement en fonction de la performance souhaitée.  Le premier objectif de ce travail sera de quantifier les relations dynamiques entre les variables de charge d'entraînement interne et externe, en prenant en compte notamment les dimensions cognitives des individus en lien avec leur environnement modulant la réponse comportementale.  Le deuxième objectif sera de comparer la précision des analyses linéaires et d'apprentissage automatique distinctes pour prédire la performance, en utilisant à la fois des données à l'échelle d'un groupe ou individuelle.  Le troisième objectif consistera à déterminer un programme d'entrainement personnalisé en fonction de l'adaptation psycho-physiologique de l'individu et des attentes de son entraineur au regard, par exemple, du rôle du sportif dans une équipe. Les fonctions cérébrales pourront être quantifiées à l'aide de techniques portables (spectroscopie proche infra-rouge et électroencéphalographie) concomitamment avec une analyse du comportement sensorimoteur, afin de prendre en compte les liens cerveau-comportement dans un environnement complexe. Un partenariat avec une équipe élite sera mis en œuvre pour un suivi longitudinal. Si les deux premiers objectifs relèvent d'un modèle de comportement objectif de l'individu qui permettra de mieux comprendre les relations entre les variables de charge d'entraînement interne et externe et ses performances (Fleurey et al., 2008 ; Giorgini et al., 2002), le troisième se réfère à un modèle plus subjectif des attentes liées à cette performance multicritère du sportif. La personnalisation de l'amélioration de la performance sportive repose sur ces deux dimensions objective et subjective de l'évaluation et nécessite l'identification des modèles de comportement et de préférences utilisés conjointement dans sa définition (Couturier et al., 2014 ; Montmain et al., 2015).

  • Titre traduit

    Multiple objective optimisation and machine learning for sports training science : from performance to health


  • Résumé

    In the context of competitive sports, research questions are usually addressed in complex environments, where the interrelationships between different variables are mostly non-linear (Perl, 2001). The use of nonlinear methods for data analysis seems particularly promising (Pfeiffer and Perl, 2006) in the field of competitive sport, where an experimental investigation design (including inferential statistical analysis methods) cannot be applied realistically because of the context of training sessions or competition. The analysis and understanding of training processes, i.e. the effect of training load on athletic performance, remains an issue for practitioners (coach, physical trainers) in sports elite. Indeed, athletic performance is multifactorial and is closely linked to the psycho-physiological adaptations induced by the training program. The external load can be defined as the work done by the athlete, measured independently of his or her internal characteristics. External load measurements can include duration, speed, distance, acceleration, etc. and is specific to the movements encountered in a physical activity and sport. The ability to quantify the external training load is essential for the athlete as it allows coaches to evaluate the effectiveness of a training program by caring for the overall health of the athlete and minimizing the risk of injuries (Hulin et al., 2016). The most recent research is mainly dominated by studies of external load determination through the accessibility of different measurement systems (GPS, inertial measurement units) that can be worn by athletes in training and / or competition. However, there remains a lack of approaches for determining the internal load other than the rate of perceived exertion, probably because of the difficulty of the necessary measures currently available to quantify features of the internal load. The internal load experienced by an athlete can be defined as the sum of physiological and psychological stimuli - stress imposed - during training activities (Impelizzeri et al., 2005). The ability to quantify the internal load is of primary importance as it allows coaches to unveil the implications of the external load and put in place the subsequent training methods without deleterious effects. It is clear that contemporary works are generally based on a relatively reductionist approach, by examining mainly the dimensions of physical fatigue related to the expression of the external load with a very limited consideration of perceptual, cognitive and mental responses, although most sports activities (especially team sports) are based on sustained concentration, perception and decision-making abilities. Considering the growing potential of portable neuroimaging techniques to provide more information on the impacts of specific workouts on brain function (Cheron et al., 2016), the quantification of the internal load could be enriched in different sports. Despite strong evidence of heterogeneity in response to training, previous studies examining the relationship between internal and external measures of training load in team sports have used linear analysis approaches such as multiple regression (Thorpe et al., 2015). Machine learning-based methods have become increasingly popular, with applications such as predicting competition results (Pfeiffer and Hohmann, 2012) and quantifying types of motion activity (De Vries et al., 2011). These approaches have the ability to account for nonlinearity in data sets and thus improve the performance of different pre-existing prediction models (Edelman-Nusser et al., 2002). Therefore, the implementation of such approaches could help to better understand the training load at an individual level, thus increasing our understanding of the relationship (s) between internal and external loads in order to prescribe and control the training load. Recent research also shows the value and contribution of multi criteria decision methods in the evaluation of athlete performance and the prevention of injuries (Bourdon et al., 2017, Blanco et al., 2018). The identification of the relationships between the internal and external loads should allow better designing the aggregation operator to assess the fitness skills of athlete. Namely, assessing his overall performance is based on the fusion of all the objective and subjective responses to training loads. Recent works in multi objectives optimization provide indications to what extent that model can help us in looking at how the training could be improved? In this thesis combining the digital and the human movement sciences, we propose to apply the latest knowledge in multi criteria decision aid analysis and data processing by learning approaches to (i) seek for numerical markers of adaptations of human under severe stress induced by training to prevent health and injury risks, and (ii) to model the decision process to define the best training strategy according to the desired performance output.  The first objective of this work will be to quantify the dynamic relationships between internal and external training load variables, taking into account in particular the cognitive and neuropsychological dimensions of individuals in relation to their environment acting on their behavioural response.  The second objective will be to compare the accuracy of separate linear and machine learning analyses to predict performance, using both group-level and individual-level data.  The third objective will be to determine a personalized training program based on the psychophysiological adaptation of the individual and the expectations of his coach. Brain functions could be be quantified using portable techniques (near infrared spectroscopy and electroencephalography) concomitantly with sensorimotor behaviour analysis to take into account brain-behaviour links in a complex environment. A partnership with an elite team will be implemented for a longitudinal follow-up. While the first two objectives are based on an objective behaviour model of the individual that will better understand the relationships between internal and external training load variables and its performance (Fleurey et al., 2008, Giorgini et al., 2002), the third refers to a more subjective model of expectations related to this multi-criteria athlete performance. The personalization of sport performance improvement is based on these two objective and subjective dimensions of the evaluation and requires the identification of behaviour and preferences models used jointly in its definition (Couturier et al., 2014, Montmain et al., 2015).