Thèse soutenue

FR
Auteur / Autrice : Elena Smirnova-Rocheva
Direction : Michel RueherBrigitte Trousse
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2011
Etablissement(s) : Nice

Résumé

FR  |  
EN

Cette thèse s’intéresse au problème de la recherche d’experts qui consiste à identifier la personne ayant les compétences recherchées. Les experts peuvent être sollicités pour diverses raisons : résoudre un problème, répondre à une question donnée relevant de leur domaine de compétence, fournir des informations plus détaillées sur un sujet, pour n’en citer que quelques exemples. Les algorithmes de l’état de l’art de la recherche d’experts identifient des experts correspondant au sujet souhaité en analysant le contenu textuel des documents où les experts sont associés. Bien qu’ils soient des outils puissants, ces modèles ignorent les réseaux sociaux et les réseaux d’informations entre experts d’un côté, et de l’autre côté entre les documents disponibles dans de tels réseaux. Dans cette thèse, nous utilisons la structure du réseau pour la recherche d’experts et nous proposons des solutions originales à ce problème et à une tâche similaire. Premièrement, nous postulons que dans un contexte réel la notion de « meilleur » expert dépend aussi de l’utilisateur et de ses besoins. Nous proposons une approche orientée utilisateur qui pondère deux facteurs qui influencent le choix de l’utilisateur : le temps de contacter un expert, et la valeur des connaissances acquises après. Nous utilisons la distance entre l’utilisateur et un expert dans un réseau social afin d’estimer le temps de la prise de contact, et nous considérons différents graphes sociaux. Nous montrons des améliorations supérieures de 50% par rapport à l’état de l’art, et ce, pour toutes les mesures de performance de recherche. Deuxièmement, nous développons un modèle génératif dont les liens sociaux d’expert sont modélisés avec le contenu textuel associé. Le modèle suppose que les liens sociaux sont déterminés par similarité d’expertise entre les candidats. En conséquence, les liens sociaux renforcent la confiance sur le niveau d’expertise de la personne si elle est connectée à des personnes avec les mêmes compétences. Le modèle proposé démontre la performance de recherche améliorée (plus de 27% en précision moyenne) par rapport à un résultat de référence. Enfin, nous montrons une solution à un problème lié désambiguïsation de noms de personnes – qui apparaît fréquemment lorsque l’indexation des documents associés à des experts partageant le même nom. Nous supposons que le moteurs de recherche d’experts fonctionne sur un ensemble de documents liés – le Web. Afin d’aider à un moteur de recherche d’experts de désambiguïser les noms de personnes, nous proposons une solution basée sur les graphes qui regroupe les pages Web selon les différentes personnes partageant le nom. Notre algorithme a été classé deuxième dans la troisième campagne de recherche des gens sur le Web parmi 8 concurrents avec un total de 257 essais soumis selon le classement de performance officiel. Les solutions présentées dans cette thèse peuvent être étendues à un problème plus général de la recherche d’entités.