Statistical analysis and modeling of nuclear architecture in Arabidopsis Thaliana

par Javier Arpón

Thèse de doctorat en Informatique appliquée

Sous la direction de Philippe Andrey.

Soutenue le 09-11-2016

à l'Université Paris-Saclay (ComUE) , dans le cadre de École doctorale Agriculture, Alimentation, Biologie, Environnement, Santé (Paris ; 2015-....) , en partenariat avec Université Paris-Sud (1970-2019) (établissement opérateur d'inscription) , Institut Jean-Pierre Bourgin (Versailles) (laboratoire) et de Projet de recherche européen EpiTRAITS (projet de recherche européen) .

Le président du jury était Liliane Bel.

Le jury était composé de Philippe Andrey, Liliane Bel, Christophe Zimmer, Paul Fransz.

Les rapporteurs étaient Christophe Zimmer, Paul Fransz.

  • Titre traduit

    Analyse statistique et modélisation de l'architecture nucléaire chez Arabidopsis thaliana


  • Résumé

    Les noyaux des cellules eucaryotes contiennent différents compartiments définis fonctionnellement ou structurellement et à multiples échelles qui présentent une distribution spatiale très ordonnée. Un défi majeur est alors d'identifier les règles selon lesquelles les compartiments nucléaires sont organisés dans l'espace et de décrire comment ces règles peuvent varier en fonction des conditions physiologiques ou expérimentales. Les statistiques spatiales ont rarement été utilisées à cette fin et se sont généralement limitées à l'évaluation de l'aléatoire complet. Ici, nous développons une approche de statistiques spatiales qui combine la cytologie, l'analyse d'image et la modélisation spatiale pour mieux comprendre les configurations spatiales à l'intérieur du noyau. Notre première contribution est un cadre méthodologique qui permet de tester des modèles d'organisation spatiale au niveau de la population. Plusieurs modèles spatiaux ont été proposés et mis en œuvre, en particulier l'aléatoire, l'aléatoire orbitale, la régularité maximale, l'aléatoire territoriale et l'aléatoire territoriale orbitale, pour analyser la distribution d'objets biologiques dans des domaines 3D finis et de formes arbitraires. De nouveaux descripteurs spatiaux, combinés aux descripteurs classiques, sont utilisés pour comparer les motifs observés à des configurations attendues sous les modèles testés. Une version non biaisée d'un test statistique publié précédemment est proposé pour évaluer la qualité de l'ajustement des modèles spatiaux sur les distributions observées. Après, nous étudions les propriétés de l'approche proposée à partir de données réelles et simulées. La robustesse de l'approche proposée aux erreurs de segmentation et la fiabilité des évaluations spatiales sont examinées. En outre, la base d'une méthode pour comparer les distributions spatiales entre différents groupes expérimentaux est proposée. Dans la dernière partie de ce travail, notre approche est appliquée à des images de noyaux cellulaires de la feuille chez A. thaliana, pour analyser la distribution spatiale de compartiments dynamiques et plastiques d'hétérochromatine, les chromocentres, qui ont un rôle important dans la structure du génome. Des noyaux isolés et des cryo-sections provenant de plantes de type sauvage ont été analysés. Nous montrons que les chromocentres présentent une distribution très régulière, ce qui confirme les résultats publiés précédemment. En utilisant nos nouveaux descripteurs, nous démontrons pour la première fois, objectivement et quantitativement, que les chromocentres présentent une localisation préférentielle périphérique. En employant un nouveau modèle spatial, nous rejetons l'hypothèse selon laquelle l'organisation régulière observée est uniquement expliquée par un positionnement périphérique. Nous démontrons en outre que les chromocentres affichent une régularité spatiale proche de la régularité maximale à l'échelle globale, mais pas à l'échelle locale. Enfin, nous utilisons des simulations pour tester un modèle selon lequel le positionnement des chromocentres est déterminé par les territoires chromosomiques et par des interactions avec l'enveloppe nucléaire. Nous avons ensuite vérifié s'il la distribution des chromocentres pouvait être modifiée par différentes mutations. Nous avons analysé les données de noyaux des mutants crwn et kaku, qui sont connus pour influencer la morphologie nucléaire. Les résultats suggèrent que ces mutations impactent en effet la morphologie nucléaire et les caractéristiques de l'hétérochromatine, mais ne modifient pas la régularité de la distribution des chromocentres même si la distance à la frontière du noyau est affectée. La généricité du cadre proposé pour analyser les distributions d'objets dans des domaines 3D finis et la possibilité d'ajouter de nouveaux modèles et descripteurs spatiaux devrait permettre d'analyser des organisations spatiales au sein de différents systèmes biologiques et à différentes échelles.


  • Résumé

    Eukaryotic cell nuclei contain distinct functionally or structurally defined compartments at multiple scale that present a highly ordered spatial arrangement. Several studies in plants and animals have pointed out to links between nuclear organization and genome functions. A key challenge is to identify rules according to which nuclear compartments are organized in space and to describe how these rules may vary according to physiological or experimental conditions. Spatial statistics have been rarely used for this purpose, and were generally limited to the evaluation of complete spatial randomness. In this Thesis, we develop a spatial statistical approach, which combines cytology, image analysis and spatial modeling to better understand spatial configurations inside the nucleus. Our first contribution is a methodological framework that allows to test models of spatial organization at the population level. Several spatial models have been developed and implemented, including randomness, orbital randomness, maximum regularity, territorial randomness or orbital territorial randomness of biological objects within finite 3D domains of arbitrary shape. New spatial descriptors, in combination with classical ones, are used to compare observed patterns to expected configurations under the tested models. An unbiased version of a previously published statistical test is proposed to evaluate the goodness-of-fit of spatial models over populations of observed patterns. In the second part of this Thesis, we investigate the properties of the proposed approach using simulated and real data. The robustness of the proposed approach to segmentation errors and the reliability of the spatial evaluations are examined. Besides, the basis for a method to compare spatial distributions between different experimental groups is proposed. In the last part of this work, the proposed approach is applied on A. thaliana leaf cell nuclei images to analyze the spatial distribution of chromocenters, which are dynamic and plastic heterochromatic compartments that have an important structural role in the genome. A first application was to analyze isolated and cryo-section nuclei from wild type plants. We show that chromocenters present a highly regular distribution, confirming previously published results. Using new spatial statistical descriptors, we then demonstrate objectively and quantitatively, for the first time, that chromocenters exhibit a preferentially peripheral localization. Employing a new spatial model, we then reject the hypothesis that the regular organization is explained solely by the peripheral positioning. We further demonstrate that chromocenters organization displays a close-to-maximum spatial regularity at the global scale, but not at the local one. Lastly, we use simulations to examine a model according to which chromocenters positioning is constrained by chromosome territories and by interactions with the nuclear boundary. The second application was to elucidate whether chromocenters distribution could be altered under different mutations. We analyze nuclei data from crwn and kaku mutants, which are known to affect nuclear morphology. The results suggest that these mutations impact on nuclear morphology and on heterochromatin features but do not alter the regularity of chromocenters distribution even when the relative distance to the border is affected. The genericity of the proposed framework to analyze object distributions in finite 3D domains and its expandability to add more spatial models and spatial descriptors should be of interest to decipher spatial organizations within biological systems at various scales.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris-Sud. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.