Apprentissage et classification pour des masses de séries temporelles multi-variées dans l'internet des objets

par Ahmad Mustapha

Projet de thèse en Informatique

Sous la direction de Karine Zeitouni et de Yehia Taher.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) , en partenariat avec DAVID - Données et Algorithmes pour une ville intelligente et durable (laboratoire) et de Université de Versailles-Saint-Quentin-en-Yvelines (établissement de préparation de la thèse) depuis le 01-11-2017 .


  • Résumé

    Avec les avancées rapides dans différents domaines des technologies de l'information et de la communication, nous avons assisté ces dernières années à l'émergence de l'internet des objets (IoT). En permettant de connecter des systèmes ubiquitaires : capteurs, appareils électroniques, machines, etc., ils contribuent à un monde connecté et plus intelligent, où les objets qui nous entourent peuvent capter, produire, communiquer et échanger des données les uns avec les autres. Gartner prédit que le nombre d'objets connectés atteindra environ 25 milliards en 2020, ce qui devrait mener à une explosion du volume de données produites. S'agissant de l'IoT, nous parlerons de masses de données de capteurs. L'exploitation efficace de ces données est ne nature à encourager l'utilisation de méthodes et outils analytiques avancés, afin de détecter instantanément ou même de prédire des situations et des évènements pertinents, et réagir en temps réel. Cette proposition de recherche est principalement orientée vers les problèmes liés l'analyse prédictive pour des masses de données de capteurs. Les verrous scientifiques sont nombreux. En effet, les recherches en cours sont insuffisantes dans l'extraction de règles prédictives fiables dans ce contexte, qui nécessite l'analyse de grandes collections de séries temporelles pouvant être très hétérogènes et empreintes de défauts dans leurs valeurs. Par ailleurs, la génération de règles pouvant s'exécuter lors de suivi en temps réel, introduit à son tour des verrous liés aux problèmes d'acquisition et de traitement de flux de données massives. Notre objectif est de combler l'écart existant entre les approches abordant l'analyse de données de capteurs sous l'angle de séries temporelles ou de flux de données, en adressant simultanément les problèmes de l'apprentissage de règles prédictives pertinentes et leur transformation en règle exécutable de suivi en temps réel dans le contexte de masses de données de capteurs.

  • Titre traduit

    Scalable Learning and Classification of Multi-variate Time-series in IoT


  • Résumé

    With the rapid development of various areas of information and communication technologies, recent years have witnessed the rise of the Internet-of-Things (IoT). IoT which is involving in connecting a variety of ubiquitous sensors, devices, and machines together, is promoting a more connected and smart world where all the objects around us can sense, produce, communicate and exchange data with each other. Gartner predicts almost 25 billion connected objects by 2020, which will generate substantial amounts of data, qualified as big sensing data in the context of IoT. Exploiting this data efficiently is likely to promote a more powerful predictive analytics, that's to instantly detect or even predict meaningful events and conditions, and react to them in real-time. This research proposal is mainly focusing on the problems related to of big sensing data analytics and predictive analytics. Dealing with this kind of data to achieve efficient predictive analytics is deemed to be highly challenging. More specifically, current research initiatives fall short to handle the learning of accurate predictive rules in big sensing data settings, that's to extract rules from massive collection of times series, that can be heterogeneous, and that can have uncertainty in their values. Besides, generating executable rules for real-time monitoring of the learned patterns is, in its turn, introducing other kind of challenges, more related to the domain of the real-time acquisition and processing of massive data streams. Our goal is to bridge the gap between the time series and stream viewpoints when it comes to sensor data analytics, while addressing both the problems of learning of accurate predictive rules and their transformation into real-time executable monitoring systems in big sensing data settings.