Méthode de filtrage collaborative pour apparier CVs et offres d'emploi

par Thomas Schmitt

Projet de thèse en Informatique

Sous la direction de Michèle Sebag et de Jean-Pierre Nadal.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec LRI - Laboratoire de Recherche en Informatique (laboratoire) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2014 .


  • Résumé

    Méthode de filtrage collaborative pour apparier CVs et offres d'emploies : Notre problématique est de développer un outil capable d'exploiter de grandes bases de données pour apparier CVs et offres d'emploi. À travers les données fournit par l'association Bernard Gregory et la société Qapa, nous avons accès aux traces d'usages des demandeurs d'emploi. Cela nous permet d'optimiser deux méthodes de filtrage collaboratif : une première méthode basé sur le contenu des description des offres et des CVs établit une distance de similitude. Cette méthode s'appuie sur le traitement du langage et sur des modèle de langage continue. Une seconde méthodes qui vient compléter la première est basé sur l'historique des utilisateur, elle permet de déterminer des caractéristiques « latentes » des offres et des demandeurs qui expliquent leur comportement. Ici nous utiliseront la factorisation de matrices et des méthodes d'optimisation.

  • Titre traduit

    A Collaborative Filtering Approach to Matching Job Openings and Job Seekers


  • Résumé

    A Collaborative Filtering Approach to Matching Job Openings and Job Seekers : Our concern is to develop a tool for matching job openings and job seekers, working on big data. There are two collaborative filtering methods : the content-based and the model-based. In the first case we compute distance between users (and items) by the content of their CV (and job propositions). We use Natural language processing and continuous language modeling. In the second method, we build a model for each users/items which describe the observed behavior – by means of « latent » factor. Here we use matrix factorization and optimization.