Thèse soutenue

Fouille de données textuelles et systèmes de recommandation appliqués aux offres d'emploi diffusées sur le web

FR  |  
EN
Auteur / Autrice : Julie Séguéla
Direction : Gilbert Saporta
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 03/05/2012
Etablissement(s) : Paris, CNAM
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche : Laboratoire : Centre d'études et de recherche en informatique et communications (Paris)
Jury : Président / Présidente : Yves Lechevallier
Examinateurs / Examinatrices : Gilbert Saporta, Yves Lechevallier, Ludovic Lebart, Emmanuel Viennet, Thierry Artières, Michel Crucianu, Yannick Fondeur, Stéphane Le Viet
Rapporteurs / Rapporteuses : Ludovic Lebart, Emmanuel Viennet

Résumé

FR  |  
EN

L'expansion du média Internet pour le recrutement a entraîné ces dernières années la multiplication des canaux dédiés à la diffusion des offres d'emploi. Dans un contexte économique où le contrôle des coûts est primordial, évaluer et comparer les performances des différents canaux de recrutement est devenu un besoin pour les entreprises. Cette thèse a pour objectif le développement d'un outil d'aide à la décision destiné à accompagner les recruteurs durant le processus de diffusion d'une annonce. Il fournit au recruteur la performance attendue sur les sites d'emploi pour un poste à pourvoir donné. Après avoir identifié les facteurs explicatifs potentiels de la performance d'une campagne de recrutement, nous appliquons aux annonces des techniques de fouille de textes afin de les structurer et d'en extraire de l'information pertinente pour enrichir leur description au sein d'un modèle explicatif. Nous proposons dans un second temps un algorithme prédictif de la performance des offres d'emploi, basé sur un système hybride de recommandation, adapté à la problématique de démarrage à froid. Ce système, basé sur une mesure de similarité supervisée, montre des résultats supérieurs à ceux obtenus avec des approches classiques de modélisation multivariée. Nos expérimentations sont menées sur un jeu de données réelles, issues d'une base de données d'annonces publiées sur des sites d'emploi.