Thèse de doctorat en Bioinformatique, analyse des génomes et modélisation
Sous la direction de Anavaj Sakuntabhai et de Jean-François Bureau.
Soutenue en 2014
à Paris 7 .
Ce travail est dédié à l'étude de l'épistasie dans la prédisposition génétique aux maladies complexes. Il existe de nombreuses méthodes dédiées à la détection de telles interactions. Le plus souvent, l'évaluation de ces méthodes utilise différentes procédures ce qui empêche la comparaison des études entre elles. Nous avons réalisé une étude comparative des performances de quelques méthodes de recherches d'interaction sur génome entier (GWIS), en particulier BOOST, MBMDR, PLINK et EPIBLASTER. Dans un deuxième projet, nous avons développé et évalué une méthode de détection de l'épistasie basée sur les odds ratio d'interaction. FORCE permet de réaliser un premier examen exhaustif des paires d'un GWIS. Pour les meilleurs candidats, une p-value exacte peut ensuite être calculée. Les performances de FORCE ont été comparées à celles de PUNK et MBMDR. Nous avons ensuite utilisé FORCE et PLINK pour analyser un jeu de données du WTCCC, concernant psoriasis. Enfin, nous avons réalisé un GWIS sur une base de données issue d'une cohorte de cas de dengue sévère et de contrôles provenant du Vietnam. Deux gènes ont été mis en évidence via leur contribution répétée à des p-values suggestives : CNTNAP5 sur le chromosome 2 en interaction avec SKAP2 sur le chromosome 7. Après enrichissement de ces deux régions par imputation, nous avons obtenu plusieurs paires satisfaisant le seuil de significativité corrigé pour un GWIS (p < ⁻¹³). L'analyse d'un jeu de données provenant d'une cohorte de cas de dengue hémorragique sévère originaires de Thaïlande, avant et après imputation, n'a pas permis la réplication du signal obtenu mais a révélé d'autres paires significatives entre CNTNAP5 et SKAP2.
Implication de l'épistasie dans les prédispositions génétiques aux maladies infectieuses
This work is dedicated to the study of epistasis in genetic susceptibility to complex diseases. To date, there are numerous tools that rely on many different statistical methods aiming to detect such interactions. Most of the time, performance assessments are based on different procedures and are thus difficult to compare throughout all the studies. We ran a comprehensive study to compare the power and false positive performance of a selection of Genome-Wide Interaction Search (GWIS) methods, in particular BOOST, MBMDR, PLINK and EPIBLASTER. In a second project, we developed and evaluated a very simple epistasis detection method relying on interaction odds ratios. Thanks to smart algorithm coding, FORCE allows the completion of the first exhaustive screening step of a GWIS on a regular desktop in a reasonable amount of time and further significance assessment on the most relevant candidates. We compared FORCE's performances to those obtained with existing methods including MBMDR and PUNK. We then applied FORCE and PLINK on psoriasis case-control data from the WTCCC. Thirdly, we performed a GWIS on a case-control severe dengue cohort from Vietnam. Two genes repeatedly contributed to genome-wide suggestive p-values: CNTNAP5 on chromosome 2 in interaction with SKAP2 on chromosome 7. Epistasis exploration after imputation-based enrichment of there 2 regions led to GWIS significant signais of interaction between SKAP2 and CNTNAP5 (p < ⁻¹³). Analysing a Thai dengue hemorrhagic fever case-only cohort before and after imputation did not allow the replication of the signal obtained on the SNPs mentioned above but revealed significant hits involving SNPs in the same SKAP2 and CNTNAP5 genes.