Statistical genetic analysis of infectious disease (malaria) phenotypes from a longitudinal study in a population with significant familial relationships

par Cheikh Loucoubar

Thèse de doctorat en Statistique génétique

Sous la direction de Avner Bar-Hen et de Aliou Diop.

Soutenue le 21-03-2012

à Paris 5 en cotutelle avec l'Université Cheikh Anta Diop de Dakar , dans le cadre de École doctorale Santé publique (2000-2015 ; Paris) .

Le président du jury était Richard Paul.

Le jury était composé de Richard Paul, Christophe Rogier, Margaret Mackinnon, Alioune Dieye.

Les rapporteurs étaient Christophe Rogier, Margaret Mackinnon.

  • Titre traduit

    Méthodes statistiques génétiques pour l’étude des phénotypes de maladies infectieuses (paludisme) à partir de données de suivi longitudinal obtenues dans des cohortes familiales


  • Résumé

    Les études longitudinales sur une longue période permettent d’échantillonner plusieurs fois le phénomène étudié et ainsi, avec des mesures répétées, dégager une tendance confirmée. Mais, dès lors, elles produisent de très larges bases de données épidémiologiques accompagnées de plus de sources de bruit par rapport aux études à observation unique ; et souvent, contiennent de la corrélation dans les mesures. Ici, nous avons présenté à travers cette thèse une étude de long terme des facteurs épidémiologiques et génétiques du paludisme menée dans deux cohortes familiales du Sénégal, l’une dans le village de Dielmo suivi pendant 19 années consécutives (1990 – 2008) et l’autre dans le village de Ndiop suivi pendant 16 années consécutives (1993 – 2008). L’objectif de ce travail de thèse a été de développer des méthodes d’analyse statistique pour identifier des gênes de susceptibilité / résistance au paludisme prenant en compte les relations familiales, les mesures répétées et des potentielles interactions génotypes – environnement dans l’évaluation des phénotypes. Par la suite, de tels phénotypes corrigés des facteurs identifiés comme potentielles sources de confusion et/ou de bruit ont été alors utilisés pour les tests de liaison et d’association génétique. Le phénotype principal étudié chez chaque volontaire a été la survenue ou non d’accès palustre, attribué à une infection au parasite Plasmodium falciparum, durant chaque trimestre de présence (PFA). Les études ont été menées de manière indépendante dans chacun des deux villages, de même que les analyses descriptives, l’estimation de la contribution génétique humaine et des effets individuels. Les tests de liaison et d’association génétique ont été réalisés par des méthodes familiales basées sur l’analyse de la transmission d’allèles des parents aux enfants (Transmission Disequilibrium Test). Ces méthodes sont connues pour être robustes par rapport au problème de la stratification de population et donc nous permettent d’augmenter la taille de notre échantillon dans les études de liaison et d’association génétique en analysant les deux villages en même temps.


  • Résumé

    Long term longitudinal surveys have the advantage to enable several sampling of the studied phenomena and then, with the repeated measures obtained, find a confirmed tendency. However, these long term surveys generate large epidemiological datasets including more sources of noise than normal datasets (e.g. one single measure per observation unit) and potential correlation in the measured values. Here, we studied data from a long-term epidemiological and genetic survey of malaria disease in two family-based cohorts in Senegal, followed for 19 years (1990–2008) in Dielmo and for 16 years (1993–2008) in Ndiop. The main objectives of this work were to take into account familial relationships, repeated measures as well as effect of covariates to measure both environmental and host genetic (heritability) impacts on the outcome of infection with the malaria parasite Plasmodium falciparum, and then use findings from such analyses for linkage and association studies. The outcome of interest was the occurrence of a P. falciparum malaria attack during each trimester (PFA). The two villages were studied independently; epidemiological analyses, estimation of heritability and individual effects were then performed in each village separately. Linkage and association analyses used family-based methods (based on the original Transmission Disequilibrium Test) known to be immune from population stratification problems. Then to increase sample size for linkage and association analyses, data from the two villages were used together.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris Descartes-Bibliothèque électronique. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.