Bifix codes, Combinatorics on Words and Symbolic Dynamical Systems - PASTEL - Thèses en ligne de ParisTech Accéder directement au contenu
Thèse Année : 2016

Bifix codes, Combinatorics on Words and Symbolic Dynamical Systems

Codes bifixes, combinatoire des mots et systèmes dynamiques symboliques

Résumé

Sets of words of linear complexity play an important role in combinatorics on words and symbolic dynamics. This family of sets includes set of factors of Sturmian and Arnoux-Rauzy words, interval exchange sets and primitive morphic sets, that is, sets of factors of fixed points of primitive morphisms. The leading issue of this thesis is the study of minimal dynamical systems, also defined equivalently as uniformly recurrent sets of words. As a main result, we consider a natural hierarchy of minimal systems containing neutral sets, tree sets and specular sets. Moreover, we connect the minimal systems to the free group using the notions of return words and basis of subroups of finite index. Symbolic dynamical systems arising from interval exchanges and linear involutions provide us geometrical examples of this kind of sets. One of the main tool used here is the study of possible extensions of a word in a set, that allows us to determine properties such as the factor complexity. In this manuscript we define the extension graph, an undirected graph associated to each word w in a set S which describes the possible extensions of w in S on the left and the right. In this thesis we present several classes of sets of words defined by the possible shapes that the graphs of elements in the set can have. One of the weakest condition that we will study is the neutrality condition: a word w is neutral if the number of pairs (a, b) of letters such that awb ∈ S is equal to the number of letters a such that aw ∈ S plus the number of letters b such that wb ∈ S minus 1. A set such that every nonempty word satisfies the neutrality condition is called a neutral set. A stronger condition is the tree condition: a word w satisfies this condition if its extension graph is both acyclic and connected. A set is called a tree set if any nonempty word satisfies this condition. The family of recurrent tree sets appears as a the natural closure of two known families, namely the Arnoux-Rauzy sets and the interval exchange sets. We also introduce specular sets, a remarkable subfamily of the tree sets. These are subsets of groups which form a natural generalization of free groups. These sets of words are an abstract generalization of the natural codings of interval exchanges and of linear involutions. For each class of sets considered in this thesis, we prove several results concerning closure properties (under maximal bifix decoding or under taking derived words), cardinality of the bifix codes and set of return words in these sets, connection between return words and basis of the free groups, as well as between bifix codes and subgroup of the free group. Each of these results is proved under the weakest possible assumptions
L'étude des ensembles de mots complexité linéaire joue un rôle très important dans la théorie de combinatoire des mots et dans la théorie des systèmes dynamiques symboliques. Cette famille d'ensembles comprend les ensembles de facteurs : d'un mot Sturmien ou d'un mot d'Arnoux-Rauzy, d'un codage d'échange d'intervalle, d'un point fixe d'un morphisme primitif, etc. L'enjeu principal de cette thèse est l'étude de systèmes dynamiques minimales, définis de façon équivalente comme ensembles factoriels de mots uniformément récurrents. Comme résultat principal nous considérons une hiérarchie naturelle de systèmes minimal contenante les ensembles neutres, les tree sets et les ensembles spéculaires. De plus, on va relier ces systèmes au groupe libre en utilisant les mots de retours et les bases de sous-groupes d'indice fini. L'on étude aussi les systèmes symboliques dynamiques engendrés par les échanges d'intervalle et les involutions linéaires, ce qui nous permet d'obtenir des exemples et des interprétations géométriques des familles d'ensembles que définis dans notre hiérarchie. L'un des principal outil utilisé ici est l'étude des extensions possibles d'un mot dans un ensemble, ce qui nous permet de déterminer des propriétés telles que la complexité factorielle. Dans ce manuscrit, nous définissons le graphe d'extension, un graphe non orienté associé à chaque mot w dans un ensemble S qui décrit les extensions possibles de w dans S à gauche et à droite. Dans cette thèse, nous présentons plusieurs classes d'ensembles de mots définis par les formes possibles que les graphes d'extensions des éléments dans l'ensemble peuvent avoir. L'une des conditions les plus faibles que nous allons étudier est la condition de neutralité: un mot w est neutre si le nombre de paires (a,b) de lettres telles que awb ∈ S est égal au nombre de lettres a tel que aw ∈ S plus le nombre de lettres b tel que wb ∈ S moins 1. Un ensemble tel que chaque mot non vide satisfait la condition de neutralité est appelé un ensemble neutre. Une condition plus forte est la condition de l'arbre: un mot w satisfait cette condition si son graphe d'extension est à la fois acyclique et connecté. Un ensemble est appelé un tree set si tout mot non vide satisfait cette condition. La famille de tree sets récurrents apparaît comme fermeture naturelle de deux familles d'ensembles très importants : les facteurs d'un mot d'Arnoux-Rauzy et les ensembles d'échange d'intervalle. Nous présentons également les ensembles spéculaires, une sous-famille remarquable de tree sets. Il s'agit également de sous-ensembles de groupes qui forment une généralisation naturelle des groupes libres. Ces ensembles de mots sont une généralisation abstraite des codages naturelles d'échanges d'intervalle et d'involutions linéaires. Pour chaque classe d'ensembles considéré dans cette thèse, nous montrons plusieurs résultats concernant les propriétés de fermeture (sous décodage maximale bifixe ou par rapport aux mots dérivés), la cardinalité des codes bifixes et les de mots de retour, la connexion entre mots de retour et bases du groupe libre, ainsi qu'entre les codes bifixes et les sous-groupes du groupe libre. Chacun de ces résultats est prouvé en utilisant les hypothèses les plus faibles possibles
Fichier principal
Vignette du fichier
TH2016PESC1036.pdf (1.35 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)
Loading...

Dates et versions

tel-01532193 , version 1 (02-06-2017)

Identifiants

  • HAL Id : tel-01532193 , version 1

Citer

Francesco Dolce. Bifix codes, Combinatorics on Words and Symbolic Dynamical Systems. Computation and Language [cs.CL]. Université Paris-Est, 2016. English. ⟨NNT : 2016PESC1036⟩. ⟨tel-01532193⟩
244 Consultations
204 Téléchargements

Partager

Gmail Facebook X LinkedIn More