Thèse de doctorat en Biostatistique
Sous la direction de Michel Chavance.
Soutenue en 2004
à Paris 11 , en partenariat avec Biostatistique (Villejuif, Val de Marne) (laboratoire) et de Université de Paris-Sud. Faculté de médecine (Le Kremlin-Bicêtre, Val-de-Marne) (autre partenaire) .
Le président du jury était Jean Maccario.
Le jury était composé de Michel Chavance, Jean Maccario, Hélène Jacqmin-Gadda, Geert Molenberghs, Florence Casset Semanaz, Catherine Huber-Carol.
Les rapporteurs étaient Hélène Jacqmin-Gadda, Geert Molenberghs.
Au cours des études longitudinales, des sujets sont observés afin de mesurer l'évolution une réponse d'intérêt. Le protocole de ces études prévoit de recueillir un certain nombre de réponses pour chaque sujet. Cependant, il est extrêmement rare que toutes les mesures prévues soient effectivement réalisées. L'analyse des données incomplètes est devenu un thème majeur de la statistique au cours des dernières années. De nombreuses méthodes ont été proposées, mais il est généralement impossible de s'assurer de leur validité. Il est désormais recommandé de réaliser une analyse de sensibilité, afin d'évaluer dans quelle mesure les résultats d'une étude peuvent être affectés par différentes hypothèses concernant le processus de données manquantes. Ce rapport souligne la nécessité de l'analyse de sensibilité, et montre comment cet objectif peut être atteint dans trois situations différentes, les données normales, les données binaires et les données de survie.
Modelling incomplete longitudinal data
In longitudinal studies, subjects are repeatedly observed to obtain measurements of some response. The protocol of such studies plans to collect a fixed number of responses for each subject, during a predefined follow-up period. However, it is extremely rare that all the planned measurements are actually performed. The analysis of incomplete data has become a major topic in statistics during the last years. Many methods have been proposed, but it is generally impossible to check their validity. It is now recommended to perform a sensitivity analysis, to evaluate the extent to which the results from a study can be affected by different assumptions regarding the missing data process. This report highlights the need for a sensitivity analysis, and shows how this aim can be achieved in three different situations, normal data, binary data and survival data.