Prévision de nouveaux liens dans les réseaux d’interactions bipartis : application au calcul de recommandation

par Nasserin Bechettara

Thèse de doctorat en Informatique

Sous la direction de Céline Rouveirol.

Thèses en préparation à Paris 13 , dans le cadre de Galilée depuis le 25-01-2008 .


  • Résumé

    Dans cette thèse, nous étudions le problème de la prévision d’apparition de nouveaux liens dans les réseaux d’interactions, Nous nous intéressons en par-ticulier aux réseaux dynamiques ayant une structure bipartite. Nous propo Sons un modèle de prévision de liens utilisant les techniques d’apprentissage automatique supervisé. Le problème de prévision de liens est considéré dansce cas comme un problème de classification binaire. Notre approche applique un schéma de propositionnalisation où chaque paire de noeuds est décrite par un ensemble d’attributs représentant des mesures topologiques. Ces mesures sont calculées dans le graphe biparti et dans les graphes projetés qui en découlent. Nous montrons que ces nouvelles similarités dites « indirectes » apportent un gain d’information bénéfique par rapport aux seules similarités directes. Cette thèse apporte aussi de nouvelles solutions au problème de déséqui libre des données dû à la disproportion inhérente entre le nombre de liens qui peuvent se former et le nombre de liens qui se forment réellement. Nous pro- posons tout d’abord d’utiliser des méthodes de soue-échantillonnage informé pour réduire le déséquilibre. Une deuxième solution au niveau algorithmique consiste en une approche d’apprentissage semi-supervisé. Dans ce cas, le problème de prévision de liens est vu comme un problème d’apprentissage à partir d’un ensemble d’instances étiquetées (classe minoritaire) et un en- semble d’instances non-étiquetées (classe majoritaire) . Nous montrons que cette nouvelle approche permet d’améliorer les performances du classifieur sur la classe minoritaire. Les différentes approches proposées sont appliquées sur les données réelles dans le cadre de deux applications : recommandation de collaborations aca démiques et recommandation de produits dans un site de vente de musique en ligne.


  • Pas de résumé disponible.