Sigfried 2 : modèles de mélange censurés et autres méthodes statistiques pour la contribution d'indicateurs spatialisables de la qualité de l'air intérieur dans les logements français

par Jean-Baptiste Masson

Thèse de doctorat en Technologies de l’information et des systèmes

Sous la direction de Gérard Govaert.

Soutenue en 2012

à Compiègne .


  • Résumé

    Cette thèse s’inscrit dans le programme CIRCE (Cancer, inégalités régionales, cantonales et environnement) qui vise à comparer des cartographies d’occurrence des cancers avec des cartographies de qualité environnementale, pour le territoire français métropolitain. Notre objectif spécifique est de construire des cartographies relatives à la qualité de l’air à l’intérieur des logements, qui soient compatibles avec cette approche. Nous avons adopté une démarche en deux étapes : premièrement construire des profils-types du point de vue de la pollution intérieure, et ensuite évaluer la fréquence locale de ces classes dans des zones prédéterminées. La première étape a nécessité le développement d’une extension de méthodes de classification bien connues, basées sur les modèles de mélange gaussiens et l’algorithme EM, au cas de données censurées (de manière déterministe). La seconde étape a fait usage de méthodes de discrimination non paramétrique, basées sur des arbres binaires de décision (CART). Malheureusement, tous les arbres construits présentent une erreur de prédiction très élevée. Même si l’on peut détecter des associations significatives bien connues entre pollution intérieure et certaines caractéristiques du logement et de ses occupants, il semble très difficile de prédire le profil-type, ou même la concentration d’une substance, à partir de ces caractéristiques. Néanmoins, la méthodologie développée a de nombreuses qualités : simplicité de mise en oeuvre, étapes distinctes permettant un contrôle régulier des résultats, flexibilité dans le choix des variables, évaluation possible de l’erreur de prédiction.

  • Titre traduit

    SIGFRIED2 : censored mixture models and other statistical methods for the development of spatializable indoor air quality indicators about french dwellings


  • Résumé

    This Ph. D. Thesis is part of the CIRCE program (Cancer, regional and cantonal environmental inequalities) which aims at comparing maps of cancer occurrence with maps of environmental quality on the French territory. Our specific goal is to build geographic maps of the indoor air quality inside the homes, that are compatible with this approach. We adopted a two-step method: first, build typical profiles of indoor air pollution, then assess these classes’ local frequencies in predefined zones. In the first step, we developed an extension of classical clustering methods, based on Gaussian mixture models and the EM algorithm, to the case of (deterministically) censored data. In the second step, we used non-parametric discrimination tools based on binary decisions trees (CART). Unfortunately, the resulting trees have a very high prediction error rate. Even if known significant associations can be found between indoor pollution and some characteristics of the building and its occupants, it seems very hard to predict the profile, or even a single pollutant’s concentration, from those characteristics. However, our methodology has numerous advantages: simplicity of use, distinct steps enabling a steady control of the results, flexible choice of the variables, availability of a prediction error rate.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (196 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. 76 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Technologie de Compiègne. Service Commun de la Documentation.
  • Disponible pour le PEB
  • Cote : 2012 MAS 2003
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.