Thèse soutenue

Approximation spline et optimalité en analyse en composantes principales

FR
Auteur / Autrice : Philippe Besse
Direction : Henri Caussinus
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance en 1989
Etablissement(s) : Toulouse 3

Mots clés

FR

Résumé

FR

Le theme principal concerne le choix de la metrique applicable au cas de l'etude descriptive d'un processus par l'analyse en composantes principales (a. C. P. ). Les observations des trajectoires du processus sont interpolees ou, selon le cas, lissees afin d'etre plongees dans un espace fonctionnel induisant une metrique adaptee a la situation etudiee. Une approche synthetique definit l'a. C. P. Et son approximation spline dans un cadre hilbertien abstrait conduisant a une presentation generale des situations envisagees dans la litterature et permettant de resoudre les problemes de convergence par discretisation et echantillonnage. Des exemples de situations concretes correspondant a des cas de processus "reguliers" ou de mesures aleatoires sont presentes. Un critere heuristique est propose pour guider le choix de la domension de representation. Les problemes precedents sont abordes sous un angle different dans le cadre du modele a effet fixe ou modele fonctionnel qui consiste a supposer que les observations "vraies" sont contenues dans un sous-espace affine de dimension reduite dont l'a. C. P. Fournit une estimation au sens des moindres carres. L'hypothese que l'erreur est affectee d'une petite variance permet alors de definir un risque moyen quadratique dont l'optimisation conduit a un critere de type gauss-markov pour le choix de la metrique et a un choix de dimension optimale si la variance de l'erreur est connue. Lorsque la variance est inconnue, une approximation par la theorie des perturbations des techniques de re-echantillonnage permet d'estimer la stabilite des sous-espaces de representation et aide ainsi au choix de la dimension. D'autres pistes ont ete explorees: l'utilisation du codage par une probabilite de transition generalisant le codage disjonctif complet en analyse des correspondances ainsi qu'une etude bibliographique consacree a l'usage des fonctions splines en statistique