Thèse en cours

Prise de décision chez les machines et les humains

FR  |  
EN
Auteur / Autrice : Nicolas Yax
Direction : Stefano Palminteri
Type : Projet de thèse
Discipline(s) : Sciences cognitives
Date : Inscription en doctorat le 01/09/2023
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Cerveau, cognition, comportement
Partenaire(s) de recherche : Laboratoire : Laboratoire de Neurosciences Cognitives et Computationnelles
Equipe de recherche : Human Reinforcement Learning
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....)

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Avec l'avancée récente des technologies d'apprentissage automatique et plus spécifiquement du traitement du langage naturel grâce à l'émergence des architectures basées sur les transformateurs (Vaswani et al., 2017), les grands modèles de langage sont devenus beaucoup plus accessibles (Brown et al., 2020) (Zhang et al., 2022) (Margaret et al., 2022). Ces modèles sont capables de compléter n'importe quel texte donné, ce qui comprend la capacité de répondre à des questions, mais aussi de résoudre de nombreuses tâches impliquant le traitement du texte, telles que la traduction ou la raisonnement. Ces capacités deviennent de plus en plus avancées, au point où le test de Turing original n'est plus particulièrement difficile. Cependant, la complexité croissante de ces modèles les rend très difficiles à analyser et il est impossible de comprendre en profondeur leur fonctionnement. Des outils de psychologie ont été développés pour étudier les humains. Alors que les modèles de langage montrent de plus en plus de compétences similaires à celles des humains, nous nous demandons si, en interagissant avec ces modèles boîte-noire de manière simple et directe, les outils de psychologie peuvent nous aider à mieux comprendre quelles sont les capacités cognitives de ces modèles. D'un autre côté, les modèles de langage ont également montré qu'ils étaient très capables de résoudre des tâches d'apprentissage par renforcement (Yao et al., 2022). L'utilisation du langage leur permet d'apprendre rapidement et de raisonner, ce qui est vital dans les environnements écologiques comme la vie des humains. Par conséquent, nous voulons examiner si ces modèles pourraient fournir un nouvel éventail d'outils pour étudier la prise de décision humaine dans des environnements très complexes, qui sont complètement en dehors de la portée des modèles actuels. L'inconvénient de ces modèles est qu'ils nécessitent beaucoup de puissance de calcul pour être formés et que seules les grandes entreprises peuvent se permettre de les former. En suivant différentes idées inspirées de la psychologie cognitive, nous nous demandons si nous pouvons améliorer la façon dont les gens entraînent réellement ces modèles afin de résoudre quelques problèmes d'ingénierie qui pourraient rendre ces modèles plus accessibles et même plus adaptés à la modélisation cognitive.