Abstraction et règles d'association pour l'amélioration des systèmes de recommandation à partir de données de préférences binaires

par Minh-Thu Tran Nguyen

Thèse de doctorat en Informatique médicale

Sous la direction de Jean-Daniel Zucker.

Soutenue en 2011

à Paris 13 .


  • Résumé

    Les systèmes de recommandation sont des systèmes de filtrage de l’information dont l’objectif est l’aide à la décision d’utilisateurs faisant face à l’augmentation incessante d’informations (sur des nouvelles, images, objets de consommations, objets culturels, etc. ) à traiter sur internet. Ces systèmes sont utilisés dans le commerce électronique, les loisirs, la presse en ligne, etc. Et représente un enjeu économique croissant. En commerce électronique, les informations nécessaires à la construction de tels systèmes sont souvent difficiles à exploiter : préférences souvent binaires, forme en longue traîne de la distribution des préférences et ajout/suppression constant d’items. De fait, la plupart des systèmes de recommandations se focalisent sur les items les plus populaires car les items nouveaux ou appartenant à la “longue traîne” sont associés à un nombre de préférences faible ou nul, et donc problématiques à recommander. Pour améliorer la performance de ces systèmes, nous proposons de recourir à l’abstraction d’items. Tout d’abord, l’abstraction des items peut conduire à une réduction considérable de l’effet longue traîne. Deuxièmement, l’extraction de règles d’association abstraites peut être utilisée pour identifier les items à recommander. Deux algorithmes sont introduits : AbsTopα, qui se base sur les règles dans l’espace des items abstraits et ACReco, qui combine les items abstraits et concrets. Ces algorithmes ont été évaluée de manière quantitative (pertinence) et qualitative (nouveauté et diversité) sur une base de données réelle d’un site d’e-commerce en ligne. Les résultats empiriques présentés montrent l’intérêt de l’approche proposée.

  • Titre traduit

    Abstraction and association rules to improve recommender systems from binary data


  • Résumé

    In recent years, recommendation systems have been extensively explored in order to help the user facing the increasing information on Internet. Those systems are used in e-commerce (Amazon, eBay, Netflix. . . ), entertainment, online news, etc. In the domain of e-commerce, the available data is often difficult to exploit to build robust recommendations : binary data, long tail of the distribution of preferences and everlasting adding or removing of items. In fact, most recommender systems focus on the most popular items because the new items or those of the "long tail" are associated with little or no preference. To improve the performance of these systems, we propose to search for association rules between abstracted items. First, the abstraction of the items can lead to a considerable reduction of the long tail effect. Second, the extraction of abstract association rules can be used to identify items to be recommended. . Two algorithms are introduced : AbsTopk, based on the rules in the space of abstract and ACReco combining items in the space of abstract and concrete items by pair. These algorithms were evaluated quantitatively (relevance) and qualitatively (novelty and diversity) on a real database of an online e-commerce site. The empirical results presented show the interest of the proposed approach.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (140 f.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. 121-133

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris 13 (Villetaneuse, Seine-Saint-Denis). Bibliothèque universitaire. Section Sciences.
  • PEB soumis à condition
  • Cote : TH 2011 094
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.