Analyse de données musicales en contexte

by Karim magdi abdelfattah Ibrahim

Thesis project in Traitement du signal et des images

Under the supervision of Gaël Richard.

Ongoing thesis at Paris Saclay , under the authority of École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) , in a partnership with LTCI - Laboratoire de Traitement et Communication de l'Information (laboratoire) , S2A - Statistique et Apprentissage (equipe de recherche) and Télécom ParisTech (établissement de préparation de la thèse) since 17-09-2018 .

  • Alternative Title

    Behavioural music data analytics


  • Abstract

    The goal of this project is to address the general problem of industrial-scale music recommendation with a novel approach, exploiting simultaneously user behavioural and contextual data in addition to audio, thus bridging the gap between content and usage-based recommendation. The idea is to build on machine learning techniques that have proven successful in the music information retrieval field (e.g. for instrument identification, music similarity etc) but to go beyond with the joint analysis of large scale behavioral and contextual data such as, for instance user localization, user environment or user activity (calm, running, …).The project will focus on exploring how to train models efficiently using such heterogeneous data. Deep learning network architecture with multiple layers and heterogeneous entry layers will be considered , , but methods of reinforcement learning (to allow for adaptive recommendation) or ensemble methods can also be of interest for the task . A specific focus will be given to semi-supervised learning strategies to cope with the fact that the majority of the data is unlabelled.


  • Abstract

    Le but de ce projet est d'aborder le problème général de la recommandation musicale à l'échelle industrielle avec une approche novatrice, exploitant simultanément les données comportementales et contextuelles de l'utilisateur en plus de l'audio, comblant ainsi l'écart entre le contenu et la recommandation. L'idée est de s'appuyer sur des techniques d'apprentissage automatique qui ont fait leurs preuves dans le domaine de la recherche d'information musicale ou MIR (par exemple pour l'identification d'instruments, la similarité musicale, etc.) mais aussi sur l'analyse conjointe de données comportementales et contextuelles à grande échelle comme la localisation, l'environnement de l'utilisateur ou l'activité de l'utilisateur (calme, fonctionnement, ...). Le projet se concentrera sur le développement de modèles efficaces et pertinents pour l'exploitation des données fortement hétérogènes. Par exemple, une architecture de réseaux de neurones profonds avec des couches d'entrée hétérogènes sera considérée. Une autre direction importante de la thèse reposera sur les méthodes d'apprentissage par renforcement (pour permettre une recommandation adaptative) et les méthodes de fusion. Une attention particulière sera accordée aux stratégies d'apprentissage semi-supervisées pour faire face au fait que la majorité des données ne sont pas étiquetées ou faiblement étiquetées.