Active control of complexity growth in Language Games

par William Schueller

Thèse de doctorat en Informatique

Sous la direction de Pierre-Yves Oudeyer.

Le président du jury était Bart De Boer.

Le jury était composé de Dan Dediu, Andrea Baronchelli.

Les rapporteurs étaient Kenny Smith.

  • Titre traduit

    Contrôle actif de la croissance de la complexité dans les Language Games


  • Résumé

    Nous apprenons très jeunes une quantité de règles nous permettant d'interagir avec d'autres personnes: des conventions sociales. Elles diffèrent des autres types d'apprentissage dans le sens où les premières personnes à les avoir utilisées n'ont fait qu'un choix arbitraire parmi plusieurs alternatives possibles: le côté de la route où conduire, la forme d'une prise électrique, ou inventer de nouveaux mots. À cause de celà, lorsqu'une nouvelle convention se crée au sein d'une population d'individus interagissant entre eux, de nombreuses alternatives peuvent apparaître et conduire à une situation complexe où plusieurs conventions équivalentes coexistent en compétition. Il peut devenir difficile de les retenir toutes, comment faisons-nous pour trouver un accord efficacement ? Nous exerçons communément un contrôle actif sur nos situations d'apprentissage, en par exemple sélectionnant des activités qui ne soient ni trop simples ni trop complexes. Il a été montré que ce type de comportement, dans des cas comme l'apprentissage sensori-moteur, aide à apprendre mieux, plus vite, et avec moins d'exemples. Est-ce que de tels mécanismes pourraient aussi influencer la négociation de conventions sociales? Le lexique est un exemple particulier de convention sociale: quels mots associer avec tel objet ou tel sens? Une classe de modèles computationels, les Language Games, montrent qu'il est possible pour une population d'individus de construire un langage commun via une série d'interactions par paires. En particulier, le modèle appelé Naming Game met l'accent sur la formation du lexique reliant mots et sens, et montre une typique explosion de la complexité avant de commencer à écarter les conventions synonymes ou homonymes et arriver à un consensus. Dans cette thèse, nous introduisons l'idée de l'apprentissage actif et du contrôle actif de la croissance de la complexité dans le Naming Game, sous la forme d'une politique de choix du sujet de conversation, applicable à chaque interaction. Différentes stratégies sont introduites, et ont des impacts différents sur à la fois le temps nécessaire pour converger vers un consensus et la quantité de mémoire nécessaire à chaque individu. Premièrement, nous limitons artificiellement la mémoire des agents pour éviter l'explosion de complexité locale. Quelques stratégies sont présentées, certaines ayant des propriétés similaires au cas standard en termes de temps de convergence. Dans un deuxième temps, nous formalisons ce que les agents doivent optimiser, en se basant sur une représentation de l'état moyen de la population. Deux stratégies inspirées de cette notion permettent de limiter les besoins en mémoire sans avoir à contraindre le système, et en prime permettent de converger plus rapidement. Nous montrons ensuite que la dynamique obtenue est proche d'un comportement théorique optimal, exprimé comme une borne inférieure au temps de convergence. Finalement, nous avons mis en place une expérience utilisateur en ligne sous forme de jeu pour collecter des données sur le comportement d'utilisateurs réels placés dans le cadre du modèle. Les résultats suggèrent qu'ils ont effectivement une politique active de choix de sujet de conversation, en comparaison avec un choix aléatoire.Les contributions de ce travail de thèse incluent aussi une classification des modèles de Naming Games existants, et un cadriciel open-source pour les simuler.


  • Résumé

    Social conventions are learned mostly at a young age, but are quite different from other domains, like for example sensorimotor skills. The first people to define conventions just picked an arbitrary alternative between several options: a side of the road to drive on, the design of an electric plug, or inventing a new word. Because of this, while setting a new convention in a population of interacting individuals, many competing options can arise, and lead to a situation of growing complexity if many parallel inventions happen. How do we deal with this issue?Humans often exhert an active control on their learning situation, by for example selecting activities that are neither too complex nor too simple. This behavior, in cases like sensorimotor learning, has been shown to help learn faster, better, and with fewer examples. Could such mechanisms also have an impact on the negotiation of social conventions ? A particular example of social convention is the lexicon: which words we associated with given meanings. Computational models of language emergence, called the Language Games, showed that it is possible for a population of agents to build a common language through only pairwise interactions. In particular, the Naming Game model focuses on the formation of the lexicon mapping words and meanings, and shows a typical burst of complexity before starting to discard options and find a final consensus. In this thesis, we introduce the idea of active learning and active control of complexity growth in the Naming Game, in the form of a topic choice policy: agents can choose the meaning they want to talk about in each interaction. Several strategies were introduced, and have a different impact on both the time needed to converge to a consensus and the amount of memory needed by individual agents. Firstly, we artificially constrain the memory of agents to avoid the local complexity burst. A few strategies are presented, some of which can have similar convergence speed as in the standard case. Secondly, we formalize what agents need to optimize, based on a representation of the average state of the population. A couple of strategies inspired by this notion help keep the memory usage low without having constraints, but also result in a faster convergence process. We then show that the obtained dynamics are close to an optimal behavior, expressed analytically as a lower bound to convergence time. Eventually, we designed an online user experiment to collect data on how humans would behave in the same model, which shows that they do have an active topic choice policy, and do not choose randomly. Contributions from this thesis also include a classification of the existing Naming Game models and an open-source framework to simulate them.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Bordeaux. Direction de la Documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.