Déterminants et prévision des fluctuations de la concentration en polluants dans un environnement intérieur

par Rachid Ouaret

Thèse de doctorat en Sciences et Techniques de l'Environnement

Sous la direction de Yves Candau.

Soutenue le 19-07-2016

à Paris Est , dans le cadre de École doctorale Sciences, Ingénierie et Environnement (Champs-sur-Marne, Seine-et-Marne ; 2015-....) , en partenariat avec Centre d'enseignement et de recherches Techniques et sociétés (Paris) (laboratoire) et de Centre d‘Études et de Recherche en Thermique, Environnement et Systèmes (laboratoire) .

Le président du jury était Christian Seigneur.

Le jury était composé de Yves Candau, Anda Ionescu, Olivier Ramalho, Nadine Locoge, Viorel Petrehus.

Les rapporteurs étaient Francis Allard, Gilles Roussel.


  • Résumé

    Les caractéristiques des fluctuations des concentrations de polluants dans un environnement intérieur normalement occupé dépendent fortement de plusieurs paramètres, en particulier des occupants et de leurs activités et comportement, qui altèrent de manière considérable la nature statistique de leur variabilité temporelle. Ces fluctuations sont rarement disponibles et décrites dans la littérature. La mise à disposition de mesures en continu de la concentration en formaldéhyde et en particules (de 0,35 à 20 µm de diamètre) dans l’air d’un environnement de bureau et d’une maison expérimentale sur plusieurs mois avec un pas de temps fin (entre 1 min et 1 heure) a permis d’engager une réflexion sur la nature de ces fluctuations et leur prévisibilité. L’objectif de la thèse se décline en trois axes de recherche : (i) la caractérisation des fluctuations des concentrations des polluants cible ; (ii) la mise en évidence des sources de variabilité de ces fluctuations et (iii) la prévision des concentrations de ces polluants. Le premier axe concerne la détermination des caractéristiques communes partagées par les différents polluants. Le deuxième axe porte, à l'aide des approches par séparation aveugle des sources, sur l'estimation des déterminants des sources de variabilité. Le troisième axe est consacré à la prévision des fluctuations de concentration des polluants. L'analyse des séries temporelles pour ce type de données (hautes fréquences) doit prendre en compte l’échelle de temps sur laquelle évoluent plusieurs microstructures. Plusieurs outils ont été employés : l'analyse spectrale (dépendance à long terme par la mesure fractale et la statistique R/S), la mesure de l’oméga-prédictibilité, ainsi que la décomposition des séries en composantes latentes par STL (seasonal trend decomposition using Loess), SSA (singular spectrum analysis) et SBD (spectral band decomposition).L'identification des sources de variabilité de particules a été abordée par les méthodes de séparation aveugle des sources basées sur une factorisation matricielle en profils et contributions, sous contrainte statistique d'indépendance (ACI) ou de non-négativité (NNMF ou PMF). Les factorisations ont été appliquées à la matrice constituée des séries temporelles de différentes gammes de taille des particules. Certains profils ou contributions des sources ont pu été interprétés grâce aux variables exogènes "traceurs" de certaines sources (comme le CO2 indicateur de la présence de la source occupants).Concernant la prévision des concentrations de polluants, le choix des modèles a été basé sur la structure de la série temporelle, mise en évidence lors de l’étape de caractérisation. On constate de meilleures performances de prévisions sur la série ayant subi un prétraitement statistique de décomposition STL, SSA ou SBD. Plusieurs types de modèles stochastiques (linéaires ou non linéaires) ont été appliqués ensuite à ces composantes et le résultat final de la prévision est donné par leur combinaison. La caractéristique de non-linéarité qui apparaît sous forme de changements abrupts de concentration causée en grande partie par la manipulation des ouvrants et qui se greffe sur l'évolution régulière du système dynamique mérite un traitement spécial. Un nouveau type de modèles de prévision a été développé pour répondre aux exigences de la nature des données hautes fréquences présentant ce type de non linéarité. Ce modèle associe une étape de décomposition des séries en bandes spectrales (SBD) couplée avec une étape de modélisation par des modèles autorégressifs à seuil (TAR) ou par la dynamique du chaos : FFT-(TAR/Chaos).Les résultats montrent que le prétraitement par décomposition en bandes spectrales ou STL améliore sensiblement la prévision des concentrations de formaldéhyde et des particules fines jusqu’à un horizon de 10 heures pour le formaldéhyde (pas de temps 1 minute) et de 1 à 4 jours pour les particules selon leur taille (pas de temps horaire)

  • Titre traduit

    Sources of fluctuations and forecast of pollutant concentrations in an indoor environment


  • Résumé

    The time fluctuation features of particulate concentrations in a real occupied indoor environment are strongly dependent of several parameters and in particular the occupation and occupants’ activities and behaviors. These parameters considerably alter the statistical variability of the time series dynamics. These fluctuations are rarely available and described in the literature. These types of fluctuations are rarely available and described in the literature. The availability of continuous measurements of concentrations of formaldehyde and particulate matter (from 0.35 to 20 µm of diameter) in an indoor environment (office and a test house) during several months with a fine time resolution (from 1 min to 1 hour) permitted to initiate a process of reflection on the nature of these fluctuations and their predictability. The aim of the thesis follows three main axis of research: (i) characterizing indoor environment pollutant concentrations variability; (ii) revealing the sources of variability of these fluctuations and (iii) forecasting the pollutant concentrations in a real indoor environment. The first axis concerns the determination of the common features shared by the different pollutants. The second axis focuses on the sources variability estimating using a Blind Source Separation (BSS) approach. Lastly, the third axis focuses on the forecasting of pollutant concentrations. The time series analysis for this type of data (high frequency) should take into account the time scale on which microstructures evolve. Several tools were employed, such as the spectral analysis (long-range dependency by fractal dimension measures and R/S statistic), the omega-predictability, as well as the time series decomposition into latent components by STL (Seasonal Trend Decomposition using Loess), SSA (Singular Spectrum Analysis) and SBD (Spectral Band Decomposition).The identification of the sources of particles concentrations is developed using BSS based methods which are based on a matrix factorization as profiles and contributions under a statistical independence constraint (ICA) or a non-negativity constraint (NNMF or PMF). The factorizations were applied to the matrix of the time series of different particle size bins. Some profiles or source contributions could be interpreted using exogenous variables as fingerprints of some sources (such as CO2 concentrations used as indicator of the “occupation”).Concerning the pollutant concentrations forecasting, the model selection was made in agreement with the time series structures, highlighted in the characterization stage. One can notice better performances forecasts when using the series having been preprocessed by decomposition: STL, SSA or decomposition in spectral bands (based Transform Fourier), SBD. Several types of stochastic models (linear or nonlinear) were then applied to these components and the final forecast result is given by their combination. A special type of nonlinearities involving a special treatment is the abrupt concentration changes in time series concentrations due mainly to windows manipulation and graft on the regular evolution of the dynamic system. A new type of forecast models has been developed in adequacy with the requirements of the nature of high-frequency data. This model combine spectral band decomposition step (SBD) coupled with a modeling stage based on autoregressive switching threshold model (TAR) or chaos dynamic: FFT- (TAR / Chaos).The results show that the pretreatment by spectral band decomposition or STL improves significantly formaldehyde and fine particles concentrations forecast on 10-hour horizon for formaldehyde (sampled every minute) and on a horizon of 1 to 4 days for the particles (sampled every hour), depending on their size bins


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Communautés d’Universités et d'Etablissements Université Paris-Est. Bibliothèque universitaire.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.