Approches collaboratives pour la classification des données complexes
Auteur / Autrice : | Mazouzi Rabah |
Direction : | Herman Akdag |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 12/12/2016 |
Etablissement(s) : | Paris 8 |
Ecole(s) doctorale(s) : | École doctorale Sciences sociales (Saint-Denis, Seine-Saint-Denis ; 2000-....) |
Partenaire(s) de recherche : | Equipe de recherche : Laboratoire d' informatique avancée de Saint-Denis |
Jury : | Président / Présidente : Anissa Mokraoui |
Examinateurs / Examinatrices : Herman Akdag, Hamid Seridi, Lynda Seddiki, Arab Ali Chérif, Cyril de Runz | |
Rapporteurs / Rapporteuses : Zahia Guessoum, Hamid Seridi |
Mots clés
Mots clés contrôlés
Résumé
La présente thèse s'intéresse à la classification collaborative dans un contexte de données complexes, notamment dans le cadre du Big Data, nous nous sommes penchés sur certains paradigmes computationels pour proposer de nouvelles approches en exploitant des technologies de calcul intensif et large echelle. Dans ce cadre, nous avons mis en oeuvre des classifieurs massifs, au sens où le nombre de classifieurs qui composent le multi-classifieur peut être tres élevé. Dans ce cas, les méthodes classiques d'interaction entre classifieurs ne demeurent plus valables et nous devions proposer de nouvelles formes d'interactions, qui ne se contraignent pas de prendre la totalité des prédictions des classifieurs pour construire une prédiction globale. Selon cette optique, nous nous sommes trouvés confrontés à deux problèmes : le premier est le potientiel de nos approches à passer à l'echelle. Le second, relève de la diversité qui doit être créée et maintenue au sein du système, afin d'assurer sa performance. De ce fait, nous nous sommes intéressés à la distribution de classifieurs dans un environnement de Cloud-computing, ce système multi-classifieurs est peut etre massif et ses propréités sont celles d'un système complexe. En terme de diversité des données, nous avons proposé une approche d'enrichissement de données d'apprentissage par la génération de données de synthèse, à partir de modèles analytiques qui décrivent une partie du phenomène étudié. Aisni, la mixture des données, permet de renforcer l'apprentissage des classifieurs. Les expérientations menées ont montré un grand potentiel pour l'amélioration substantielle des résultats de classification.