Industrialisation des procédures d'analyses de données de séquençage pan-génomiques constitutionnelles - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2021

Industrialization of constitutional pan-genomic sequencing data analysis procedures

Industrialisation des procédures d'analyses de données de séquençage pan-génomiques constitutionnelles

Résumé

The number of rare diseases is assessed between 5000 and 8000 distinct pathologies. Individually, these diseases are rare, but together they represent a major health problem at the population level. Because of the limited number of patients with certain diseases and the lack of knowledge about them, diagnosis for patients is often delayed.More than 80 % of rare diseases have a genetic origin, the vast majority of which are monogenic. The democratization of high-throughput sequencing technologies since 2005 has allowed the massive acquisition of genomic data from both healthy individuals and patients. However, establishing a diagnosis of a rare disease with current molecular biology technologies remains difficult.The industrial-scale application of exome and genome sequencing analyses associated with the constant increase in medical knowledge represents a concrete hope to bring a diagnosis to the majority of patients concerned by a rare disease suspected to be genetic.This thesis was particularly interested in the implementation of processes for constitutional genome-wide sequencing data analysis following industrial standards and bioinformatics good practices. Then, in the detection of copy number variations from exome sequencing data, but under-explored by many laboratories.Finally, this thesis has allowed the development and the initiation of collaborations still active today. This has been concretized by a study on detection of small somatic variations in an in vitro model of cancer development linked to the cellular microenvironment, the detection of structural variations using the innovative Oxford Nanopore sequencing technology and the comparison of prioritization methodologies for genetic variations using clinical descriptions based on HPO terms.
Le nombre de maladies rares est estimé à entre 5000 et 8000 pathologies distinctes. Elles sont individuellement rares puisque par définition elles affectent moins de 1 individu sur 2000 dans la population générale, mais leur nombre les rend collectivement fréquentes. En raison du nombre limité de patients atteints de certaines maladies et du manque de connaissances à leur sujet, le diagnostic pour les patients est souvent retardé.Plus de 80 % des maladies rares auraient une origine génétique, en grande majorité monogénique. La démocratisation des technologies de séquençage à haut débit depuis 2005 a permis l’acquisition massive de données génomiques que ce soit d’individus sains ou de patients. Pourtant, établir un diagnostic de maladie rare avec les technologies de biologie moléculaire actuelle reste difficile.L’application à échelle industrielle des analyses de séquençage d’exome et de génome associée avec l’augmentation constante des connaissances médicales représente un espoir concret pour apporter un diagnostic à la majorité des patients concernés par une maladie rare suspecte d’être génétique.Cette thèse s’est particulièrement intéressée à la mise en place de processus d’analyse de données de séquençage pangénomiques constitutionnelles selon les standards industriels et les bonnes pratiques en vigueur dans le domaine. Puis, à la détection de variations de nombre de copies à partir de données de séquençage d’exomes, analyse souvent inexplorée par de nombreux laboratoires.Enfin, cette thèse aura permis le développement et l’initiation de collaborations encore actives à ce jour. Cela s’est concrétisé par une étude ayant comme objet la détection de variations la détection somatique de petite taille dans un modèle in vitro de développement de cancer lié au microenvironnement cellulaire, la détection de variations structurales à l’aide de la technologie de séquençage novatrice Oxford Nanopore et la comparaison de méthodologies de priorisations de variations génétiques à l’aide de descriptions cliniques basées sur les termes HPO.
Fichier principal
Vignette du fichier
TESTARD_2021_archivage.pdf (17.25 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03664086 , version 1 (10-05-2022)

Identifiants

  • HAL Id : tel-03664086 , version 1

Citer

Quentin Testard. Industrialisation des procédures d'analyses de données de séquençage pan-génomiques constitutionnelles. Biologie du développement. Université Grenoble Alpes [2020-..], 2021. Français. ⟨NNT : 2021GRALV064⟩. ⟨tel-03664086⟩
165 Consultations
121 Téléchargements

Partager

Gmail Facebook X LinkedIn More