Auteur / Autrice : | Younés Hafri |
Direction : | Chaabane Djeraba |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2005 |
Etablissement(s) : | Nantes |
Ecole(s) doctorale(s) : | École doctorale sciences et technologies de l'information et des matériaux (Nantes) |
Mots clés
Mots clés contrôlés
Résumé
Les recherches sur les modèles de prédiction de parcours sur le Web ont largement inspiré les chercheurs ces dernières années. Beaucoup d'algorithmes ont été proposés tels que les systèmes de recommandations, les guides de lecture, les caches serveur et les sites adaptatifs. L'objectif est toujours la réduction des temps de latences perçus par les utilisateurs à la recherche d'une information. Les modèles de Markov d'ordre k>1 sont bien adaptés pour répondre à ce besoin. Bien que ces modèles soient plus précis, ils sont pénalisés par leur nombre d'états et leur faible couverture des données. Cette thèse propose de résoudre cette problématique par la construction d'un modèle appelé Chaînes de Markov Combinées. Ce dernier fusionne les propriétés de plusieurs chaînes afin d'obtenir un ensemble d'états très réduit, des prédictions précises et une bonne couverture des données. D'autre part, nous avons développé un crawler web hautement performant, flexible par son déploiement sur un cluster de machines et sa gestion des pannes. Enfin, nous avons comparé ses performances par rapport aux crawlers existants de la littérature.