Etude bioinformatique de populations virales au sein de patients infectés par le virus de l'hépatite C

par Om Kulkarni

Thèse de doctorat en Modèles, méthodes et algorithmes en biologie, santé et environnement

Sous la direction de Michaël Blum et de Olivier François.

Le président du jury était Laurence Després.

Les rapporteurs étaient Samuel Alizon, Dirk Metzler.


  • Résumé

    Le virus de l'hépatite C (VHC) est une menace majeure avec plus de 130 millions de personnes infectées chaque année. Il constitue la principale cause de cancer du foie. Le VHC est un virus transmis par le sang soit au cours de consommation de drogue par voie intraveineuse soit lors de transfusions sanguines. Il s'adapte à l'environnement de l'hôte grâce à un taux de mutation élevé qui amoindrit l’efficacité des traitements. Le virus se multiplie rapidement dans l'hôte et crée ainsi une population de virus génétiquement hétérogènes, appelée quasi-espèces, qui peut ainsi répondre aux pressions sélectives liées au traitement. Les traitement antiviraux existants sont des tri-thérapies contenant des peg-interféron, de la ribavirine et des inhibiteurs de la protéine (PI). Les inhibiteurs comme la telaprevir ou la bocéprévir ciblent la région NS3 du génome en bloquant le mécanisme de réplication. Cependant, en raison de la nature dynamique des quasi-espèces, les séquences cibles sont variables et les inhibiteurs conçus pour se lier à une région génomique particulière sont rendus inefficaces.Nous analysons ces populations virales en utilisant les techniques modernes de séquençage et le pyroséquencage profond qui permet l’analyse à grande échelle des données génétiques. La technique “Amplicon Sequencing” permet de cibler des régions particulières du génome viral, comme les régions NS3 ou NS5B qui participent au mécanisme de réplication et qui sont des cibles pour les thérapies antivirales. Par rapport au séquençage Sanger, notre pipeline NGS permet d’appréhender l’hétérogénéité de la population virale au sein d’un hôte. Pour analyser les données NGS, nous avons implémenté un pipeline d’analyse bioinformatique qui a été automatisé avec eHive.Nous étudions des échantillons de VHC de 40 patients traités par trithérapie. Deux sources de cellules virales sont utilisées pour le séquençage: les cellules du plasma et les cellules mononuclées du sang périphérique. L'objectif est de vérifier si une analyse des mutations de la région génomique NS3 peut aider à prédire le résultat du traitement. Nous constatons que des mutations de résistance aux antiviraux se trouvent à la fois chez les individus qui ont répondu et qui n’ont pas répondu au traitement. Nous avons donc recherché d'autres signatures génétiques de l'échec du traitement. Nous constatons que l'hétérogénéité génétique est plus faible chez les individus qui répondent de manière favorable au traitement. Notre conclusion est que l'hétérogénéité virale est un facteur indépendant pour prédire la réponse à un traitement, en plus de la présence de mutations spécifiques dans les régions ciblées par le traitement.Les techniques NGS permettent également d’étudier l'évolution virale au sein d'un seul hôte. En utilisant de multiples temps d'échantillonnage, nous pouvons mesurer les caractéristiques de l'évolution de la population virale. Pour trois patients avec des échantillons viraux couvrant une période de 13 ans, nous avons utilisé la technique “Amplicon Sequencing“ pour les régions NS3 et NS5B. Des infections mixtes comprenant de multiples génotypes sont retrouvées chez deux patients. Nous avons montré qu’il existe de la structure de populations et des lignées divergentes de VHC au sein de chaque patient. Au cours du traitement, l'hétérogénéité génétique et la taille efficace de la population dans la région NS5B augmente fortement après le début du traitement. Ces résultats mettent en évidence un processus de sélection diversifiante suite au traitement qui augmente l'hétérogénéité génétique virale. Nous mettons ainsi en évidence un processus dit de balayage sélectif doux qui est observé pour la première fois chez des patients infectées par des génotypes multiples du virus VHC.Notre analyse NGS montre que l'hétérogénéité génétique du VHC est liée à l'échec ou à la réussite du traitement et que son évolution permet de mieux comprendre la façon dont les virus s'adaptent au traitement.

  • Titre traduit

    Bioinformatics analyses of next generation sequencing data for studying within patient genetic heterogeneity of Hepatitis C virus


  • Résumé

    Hepatitis C virus (HCV) is a major threat to global health, with over 130 million annual infections. HCV is a blood borne virus transmitted primarily via intravenous drug use or hospital transfusions. It infects the liver cells and is the leading cause of liver cancer. It adapts to the host environment with a high mutation rate and can make efficient treatment very difficult. Due to poor replication proofreading, the virus multiplies rapidly in the host and creates a population of viruses which is genetically heterogeneous enough to escape selective pressures. This HCV population called quasispecies is found within and between infected hosts. Current antiviral treatment consists of a triple therapy of peg-Interferon, ribavirin and protein inhibitors (PI). PIs such as telaprevir, boceprevir target the NS3 region of the genome, blocking the replication mechanism. However due to the highly dynamic nature of the quasispecies, the target sequences are variable and PIs designed to bind to a particular genomic region are therefore rendered ineffective.We analyse viral populations of HCV using Next generation Sequencing (NGS) technologies and ultradeep pyrosequencing, which allow for rapid and large scale analysis of genetic data. Amplicon sequencing allows for targeting particular regions of the viral genome, such as the NS3 or NS5B which form a part of the replication mechanism and hence are targets for antiviral therapy. Compared to Sanger sequencing, our NGS pipeline ascertains viral population heterogeneity within a host. We implemented the bioinformatics workflow manually and in eHive as an automated pipeline.We study HCV samples from 40 patients treated with triple therapy. Two sources of the virus, plasma and peripheral blood mononuclear cells are used for sequencing. The main aim is to check if a baseline analysis of the NS3 genomic region can help to predict the outcome of the treatment. We find that antiviral resistance mutations are found in both responders and non-responders to the treatment. Since no correlation exists between observed mutations and failure of tri-therapy, we look for other genetic signatures of treatment failure. We find that genetic heterogeneity, calculated using Shannon’s entropy, is lower in responders. We conclude that the viral heterogeneity can be used as an independent factor to predict response to treatment, more than presence of specific mutations at baseline.NGS also enables large-scale studies of viral evolution within a single host. Using multiple sampling time points, we gain insights about viral evolutionary characteristics of HCV and responses to selective pressures during infection. For three patients with viral samples covering a period of 13 years, we perform amplicon sequencing on the NS3 and NS5B regions. Mixed infections comprising of multiple genotypes are found in two patients. We find considerable population structure and diverging HCV lineages within each patient. Over the course of treatment, genetic heterogeneity and effective population size in the NS5B regions increases sharply after treatment initiation compared to baseline. These results provide evidence of diversifying selection occurring post-treatment, acting on standing genetic variation resulting in high genetic heterogeneity. These are characteristics of a soft selective sweep, which is observed for the first time in chronic HCV patients infected with multiple genotypes.Our NGS analysis show that genetic heterogeneity in HCV is related to treatment failure and that its evolution provides insights about how viruses adapt to treatment.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Savoie Mont Blanc (Chambéry-Annecy). Service commun de la documentation et des bibliothèques universitaires. Bibliothèque électronique.
  • Bibliothèque : Service Interétablissement de Documentation. LLSH Collections numériques.
  • Bibliothèque : Service interétablissements de Documentation. STM. Collections numériques.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.