Thèse soutenue

Des textes communautaires à la recommandation
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Damien Poirier
Direction : Isabelle TellierPatrick Gallinari
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 11/02/2011
Etablissement(s) : Orléans
Ecole(s) doctorale(s) : Ecole doctorale Sciences et technologies (Orléans)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique fondamentale d'Orléans (Orléans ; 1987-....) - Laboratoire d'Informatique Fondamentale d'Orléans
Jury : Président / Présidente : Brigitte Grau
Examinateurs / Examinatrices : Isabelle Tellier, Patrick Gallinari, Brigitte Grau, Mohand Boughanem, Patrice Bellot, Nathalie Denos, Cécile Bothorel, Françoise Fessant
Rapporteurs / Rapporteuses : Mohand Boughanem, Patrice Bellot

Mots clés

FR  |  
EN

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

La thèse concerne la transformation de données textuelles non structurées en données structurées et exploitables par des systèmes de recommandation. Deux grandes catégories d'informations sont utilisées dans le domaine des moteurs de recommandation : les données descriptives de contenus comme les méta-données ou les tags (filtrage thématique), et les données d'usages qui peuvent être des notes ou encore des pages Web visitées par exemple (filtrage collaboratif). D'autres données sont présentes sur le Web et ne sont pas encore réellement exploitées. Avec l'émergence du Web 2.0, les internautes sont de plus en plus amenés à partager leurs sentiments, opinions, expériences sur des produits, personnalités, films, musiques, etc. Les données textuelles produites par les utilisateurs représentent potentiellement des sources riches d'informations qui peuvent être complémentaires des données exploitées actuellement par les moteurs de recommandation et peuvent donc ouvrir de nouvelles voies d'études dans ce domaine en plein essor. Notre objectif dans le cadre de la thèse est de produire, à partir de commentaires issus de sites communautaires (blogs ou forums), des matrices d'entrées pertinentes pour les systèmes de recommandation. L'idée sous-jacente est de pouvoir enrichir un système pour un service débutant, qui possède encore peu d'utilisateurs propres, et donc peu de données d'usages, par des données issues d'autres utilisateurs. Nous faisons tout d'abord un état de l'art de la recommandation automatique. Nous présentons ensuite le moteur ainsi que les données utilisées pour les expérimentations. Le chapitre suivant décrit les premières expérimentations en mode thématique. Nous faisons ensuite un nouvel état de l'art sur la classification d'opinion. Pour finir, nous décrivons les expérimentations menées pour l'approche collaborative à l'aide de la classification d'opinion.