Un système à l'approche basée sur le contenu pour la recommandation personnalisée d'articles de recherche

par Wei You

Thèse de doctorat en Technologies de l'information et des systèmes

Sous la direction de Jean-Paul Barthès et de Dominique Fontaine.

Soutenue en 2011

à Compiègne .

  • Titre traduit

    Personalized recommendation for research papers


  • Pas de résumé disponible.


  • Résumé

    La recommandation personnalisée d'article de recherche filtre les publications selon les centres d'intérêt spécifiques en recherche des utilisateurs, et, bien menée, pourrait considérablement alléger le problème de la surcharge d'informations. Le filtrage basé sur le contenu est une solution prometteuse pour cette tâche parce qu'elle exploite efficacement la nature textuelle des articles de recherche. En général, la recommandation d'articles de recherche basée sur le contenu pose trois questions essentielles : la représentation des articles candidats, la construction du profil utilisateur, et la conception d'un modèle qui permette de comparer la représentation du contenu des articles candidats avec la représentation des intérêts de l'utilisateur cible. Dans cette thèse, nous développons tout d'abord une technique d'extraction automatique d'expressions-clés pour représenter les articles scientifiques. Cette technique améliore les approches existantes en utilisant une localisation plus précise des expressions-clés potentielles et une nouvelle stratégie pour éliminer le chevauchement dans la liste de sortie. Cette technique est un acteur majeur du système : en effet, non seulement elle fournit une représentation de l'article candidat, mais elle est également réutilisée pour la construction de l'ontologie de domaine, et pour l'analyse des articles appartenant à l'histoire des utilisateurs. Ensuite, pour la construction du profil utilisateur, nous proposons une nouvelle approche basée sur les ontologies. Le profil ontologique de l'utilisateur peut être décrit comme suit : tous les utilisateurs partagent une ontologie de domaine commune qui représente la base de connaissances des utilisateurs. Pour chaque utilisateur, nous créons alors une instance personnelle de l'ontologie étendue pour représenter ses besoins spécifiques. Cette instance personnelle contient tous les concepts intéressants pour l'utilisateur, et chaque concept est annoté par un score d'intérêt qui reflète le degré d'intérêt de l'utilisateur pour ce concept. On distingue les chercheurs chevronnés et les jeunes chercheurs en dérivant leurs intérêts en recherche individuelle à partir des différents ensembles de leur histoire. Nous utilisons également la structure des ontologies et appliquons l'algorithme de propagation nommé "spreading activation" pour déduire les intérêts possibles de l'utilisateur. Finalement, nous explorons un nouveau modèle pour produire des recommandations en recourant à la théorie Dempster-Shafer. On observe que quand un chercheur veut décider si oui ou non un article de recherche l'intéresse, il peut considérer le texte de l'article comme une suite d'expressions. Les expressions relatives à ses centres d'intérêt en recherche encouragent une lecture poussée de l'article, tandis que les expressions relevant de sujets qui ne l'intéressent pas diminuent son intérêt pour l'article. Notre modèle simule ce processus d'évaluation. Du point de vue de la théorie de croyance, les termes clés extraits à partir d'un article candidat peuvent être considérés comme des sources de croyance. A ces parts de croyance, notre modèle associe des degrés d'intérêt de l'utilisateur. Dés lors, comme ces croyances s'accumulent et se renforcent, une inclination prend forme et devient graduellement plus nette. Différentes d'autres mesures basées sur la similarité entre la représentation des articles candidats et les profils utilisateur, nos recommandations, produites en combinant toutes les parts de croyance, peuvent directement mesurer à quel point l'utilisateur pourrait être intéressé par l'article candidat. Les résultats expérimentaux montrent que le système que nous avons développé surpasse la plupart des approches actuelles. De plus, la méthode proposée est suffisamment générique pour permettre la résolution d'autres tâches de recommandation.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (198 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. 159 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Technologie de Compiègne. Service Commun de la Documentation.
  • Disponible pour le PEB
  • Cote : 2011 YOU 1922
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.