Development of statistical methods for DNA copy number analysis in cancerology

par Morgane Pierre-Jean

Thèse de doctorat en Sciences de la vie et de la santé

Sous la direction de Catherine Matias et de Pierre Neuvial.

Le président du jury était François Radvanyi.

Le jury était composé de Catherine Matias, Guillemette Marot-Briend, Cyril Dalmasso.

Les rapporteurs étaient Jean-Philippe Vert, Anne-Laure Boulesteix, Nancy Zhang.

  • Titre traduit

    Développement de méthodes statistiques pour l'analyse du nombre de copies d'ADN en cancérologie


  • Résumé

    Les données génomiques issues d'expériences de puces à ADN ou de séquençage ont deux caractéristiques principales: leur grande dimension (le nombre de marqueurs dépassant de plusieurs ordres de grandeurs le nombre d'observations), et leur forte structuration (notamment via les dépendances entre marqueurs). La prise en compte de cette structuration est un enjeu clé pour le développement de méthodes performantes en grande dimension.Cette thèse est axée sur les données présentant une forte structure le long du génome. C'est le cas des données de nombres de copies d'ADN, mais aussi des données de génotypes. La thèse couvre à la fois le développement de méthodes statistiques, l'implémentation logicielle, et l'application des méthodes développées à des jeux de données réelles. Nous avons, en particulier, étudié des méthodes de segmentation, et de dictionary learning. Toutes les implémentations logiciel de ces méthodes sont librement disponibles sous forme de packages R.


  • Résumé

    Genomic data from DNA microarray or sequencing technologies have two major characteristics: their high dimension (number of markers larger than the number of observations), and their strong structuration (dependence between markers). Taking into account this structuration, it is a challenging issue for the development of efficient methods.This work is focused on the data with a strong spatial structuration, namely DNA copy number data in tumor samples. We developed statistical models, software implementations and we applied these developments to real data. We explored in particular segmentation models and dictionary learning methods. All the software Implementations of these methods are freely available as R packages.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Autre version

Development of statistical methods for DNA copy number analysis in cancerology


Consulter en bibliothèque

à

Informations

  • Sous le titre : Development of statistical methods for DNA copy number analysis in cancerology
  • Détails : 1 vol. (VIII-223 p.)
  • Annexes : Bibliogr. p. 211-223.
La version de soutenance de cette thèse existe aussi sous forme papier.

Où se trouve cette thèse ?