Big Data appliqué aux industries culturelles: vers la modélisation et le prototypage d'un système de recommandation destiné aux usagers d'un service documentaire de recherche : cas de l'Institut Marocain de la l'Information Scientifique et Technique (IMIST)

par Amine Sennouni

Projet de thèse en Sciences de l'information et de la communication

Sous la direction de Ghislaine Chartron et de Boubker Sbihi.

Thèses en préparation à Paris, CNAM en cotutelle avec l'Ecole des Sciences de l'Information , dans le cadre de École doctorale Abbé Grégoire (Paris) , en partenariat avec Dicen IDF - Dispositifs d'information et de communication à l'ère numérique – Paris, Ile-de-France (laboratoire) et de Axe 2 : publication, communication et accès aux savoirs  (equipe de recherche) depuis le 01-09-2014 .


  • Résumé

    Les systèmes de recommandations sont parmi les volets prometteurs de l'apprentissage automatique, qui ont révolutionné la recherche de l'information. Ce concept reste nouveau dans les services documentaires dédiés à la recherche, et rare sont les travaux qui traitent de ces systèmes dans des services documentaires physiques et destinés à une catégorie précise d'usagers. C'est dans ce cadre que s'inscrit notre thèse, ayant pour objectif de concevoir et mettre en œuvre un système de recommandation basé sur les données implicites des usagers de l'Institut Marocain de la Recherche Scientifique et Technique (IMIST), en s'appuyant sur l'approche par filtrage collaboratif. Trois sous objectifs ont servi pour orienter mon travail : • Diagnostiquer l'existant et identifier le besoin de l'IMIST en termes d'usage d'un système de recommandation ; • Modéliser un système de recommandation pour l'IMIST ; • Mettre en œuvre le prototype de moteur de recommandation adapté à l'IMIST. Pour aboutir au résultat escompté, nous avons commencé tout d'abord par relever le besoin de l'IMIST à un système de recommandation, nous avons ensuite modélisé et mis en place un prototype qui se base sur les données implicites des usagers chercheurs, pour leur fournir des recommandations. Ce prototype distingue entre l'usager anonyme, qui bénéficie des recommandations selon les notices consultés, et l'usager abonné, pour lequel le système offre des recommandations personnalisées selon son profil, ainsi il a fallu convertir les données implicites des usagers en données explicites pour pouvoir les exploiter. L'implémentation du système a été faite dans un environnement Spark, à l'aide du langage Scala, et à travers l'emploi du modèle ALS(le modèle des moindres carrés alternés)de la factorisation matricielle.

  • Titre traduit

    Big Data applied to cultural industries: towards the modeling and prototyping of a recommender system for users of a research document service: case of the Moroccan Institute of Scientific and Technical Information (IMIST)


  • Résumé

    Recommendation systems are among the promising components of machine learning, which have revolutionized the information research. This concept remains new in libraries, and rare are the works that deal with this point. It is within this context that our end of studies project fits, carried out within the Moroccan Institute for Scientific and Technical Information (IMIST), having as a goal to design and implement a recommendation system based on the implicit library users ‘data, based on the collaborative filtering approach. Three sub-objectives were used to guide my work: • Diagnose the existing situation ,and identify the need for the IMIST in terms of the use of a recommendation system; • Modeling a recommendation system for the IMIST; • Implement the prototype engine of Recommendation adapted to the IMIST. In order to carry out this stydy, we first began to identify the IMIST's need for a recommendation system, then we design and carry out a prototype based on implicit user's data to provide recommendations. This prototype distinguishes between the anonymous user, who benefits from the recommendations according to the notices consulted, and the subscriber user, for whom the system offers personalized recommendations according to his profile. It was necessary to convert the implicit data of the users into explicit data in order to exploit them. The implementation of the system was done in a Spark environment, using the Scala language, and using the ALS Tain Implic model of the matrix factorization.