Méthodes d'imputation sur les données fonctionnelles

par Chayma Daayeb

Projet de thèse en Biostatistique

Sous la direction de Ali Gannoun et de Mohamed Mnif.

Thèses en préparation à Montpellier en cotutelle avec l'Université de Tunis - El Manar , dans le cadre de École Doctorale Information, Structures, Systèmes , en partenariat avec IMAG - Institut Montpelliérain Alexander Grothendieck (laboratoire) et de EPS - Equipe de Probabilités et Statistique (equipe de recherche) depuis le 14-11-2018 .


  • Résumé

    Dans ce projet, nous nous intéressons aux modèles fonctionnels (modèles de régression caractérisés par la présence des données fonctionnelles). À titre d'exemple, un des modèles les plus célèbres dans le contexte est le modèle non-paramétrique fonctionnel (Ferraty et Vieu, 2006), qui relie une variable réponse Y dans R à une variable explicative X dans l'espace H. Le lien entre les deux variables X et Y s'écrit alors Y = Z(X)+ E , où E est une variable réelle centrée représentant l'erreur du modèle, de variance finie. Z est la fonctionnelle de régression. Elle appartient à un ensemble spécifique d'opérateurs de H à valeurs dans R. Cependant, pour diverses raisons, il peut arriver que certaines observations de la variable réponse Y ou/et la variable explicative X ne soient pas disponibles (manquantes). Nous nous intéressons au modèle paramétrique ou non-paramétrique ou semi-paramétrique fonctionnel lorsque la variable réponse, réelle ou fonctionnelle, est sujette à des observations manquantes et la variable explicative, fonctionnelle, est complètement observée ou contenant elle aussi des observations manquantes.

  • Titre traduit

    Imputation methods on functional data


  • Résumé

    In this project, we are interested in functional models (regression models characterized by the presence of functional data). As an example, one of the most famous models in the context is the functional non-parametric model (Ferraty and Vieu, 2006), which links a response variable Y in R to an explanatory variable X in the space H. The link between the two variables X and Y is then written Y = Z(X) + E, where E is a centered real variable representing the error of the model, of finite variance. Z is the regression functional. It belongs to a specific set of operators of H with values in R. However, for various reasons, some observations of the response variable Y or / and the explanatory variable X may be unavailable (missing). We are interested in the functional parametric or non-parametric or semi-parametric model when the response variable, real or functional, is subject to missing observations and the explanatory, functional variable is completely observed or also contains missing observations.