Classification interactive multi-label pour l’aide à l’organisation personnalisée des données

par Noureddine Yassine Nair Benrekia

Thèse de doctorat en Informatique et applications

Sous la direction de Pascale Kuntz-Cosperec et de Frank Meyer.

Le président du jury était Philippe Preux.

Le jury était composé de Pascale Kuntz-Cosperec, Frank Meyer, Philippe Preux, Younès Bennani, Christel Vrain.

Les rapporteurs étaient Younès Bennani, Christel Vrain.


  • Résumé

    L'importance croissante donnée actuellement aux contenus personnalisés a conduit au développement de plusieurs systèmes de classification interactive pour diverses applications originales. Néanmoins, tous ces systèmes recourent à une classification mono-label des items qui limite fortement l'expressivité de l'utilisateur. Le problème majeur commun à tous les développeurs d'un système de classification interactif et multi-label est: quel classifieur multi-label devrions-nous choisir? Les évaluations expérimentales des systèmes d'apprentissage interactifs récents sont essentiellement subjectives. L:importance de leurs conclusions est donc limitée. Pour tirer des conclusions plus générales qui permettent de guider la sélection de l'algorithme d'apprentissage approprié lors du développement d'un tel système, nous étudions de manière approfondie l'impact des contraintes d'interactivité majeures (apprentissage à partir de peu d'exemples en un temps limité) sur les performances prédictives et les temps de calcul des classifieurs. Les expérimentations mettent en évidence le potentiel d'une approche d'apprentissage ensemble Random Forest of Predictive Clustering Trees(RF-PCT). Cependant, la forte contrainte sur le temps de calcul posée par l'interactivité, nous a conduits à proposer une nouvelle approche d'apprentissage hybride FMDI-RF+ qui associe RF-PCT avec une approche de factorisation de matrice efficace pour la réduction de dimensions. Les résultats expérimentaux indiquent que FMDI-RF+ est aussi précise que RF-PCT dans les prédictions avec clairement un avantage à FMDI-RF+ pour la vitesse de calcul.

  • Titre traduit

    Interactive multi-label classification for the personalized organisation of data


  • Résumé

    The growing importance given today to personalized contents led to the development of several interactive classification systems for various novel applications. Nevertheless, all these systems use a single-label item classification which greatly constrains the user's expressiveness. The major problem common to all developers of an interactive multi-label system is: which multi-label classifier should we choose? Experimental evaluations of recent interactive learning systems are mainly subjective. The importance of their conclusions is consequently limited. To draw more general conclusions for guiding the selection of a suitable learning algorithm during the development of such a system, we extensively study the impact of the major interactivity constraints (learning from few examples in a limited time) on the classifier predictive and time-computation performances. The experiments demonstrate the potential of an ensemble learning approach Random Forest of Predictive Clustering Trees(RF-PCT). However,the strong constraint imposed by the interactivity on the computation time has led us to propose a new hybrid learning approach FMDI-RF+ which associates RF-PCT with an efficient matrix factorization approach for dimensionality reduction. The experimental results indicate that RF-FMDI+ is as accurate as RF-PCT in the predictions with a significant advantage to FMDI-RF + for the speed of computation.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (123 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.103-110

Où se trouve cette thèse ?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. BU Sciences.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.