Thèse soutenue

Cartographies pour la recherche et l'exploration de données documentaires
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Jérôme Thièvre
Direction : Jocelyne NanardMountaz Hascoët
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2006
Etablissement(s) : Montpellier 2

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Cette thèse s’appuie sur les techniques de visualisation d’information afin d’explorer et d’analyser des données documentaires. Deux représentations sont étudiées d’un point de vue théorique et pratique : les diagrammes de Venn-Euler et les diagrammes noeud-lien. Les diagrammes de Venn-Euler sont des représentations ensemblistes. Nous les utilisons comme interface de formulation graphique de requêtes booléennes. Chaque diagramme constitue aussi une cartographie de la base documentaire qui fournit des informations sur son contenu et sur la qualité des termes de recherche employés. Les diagrammes noeud-lien permettent quant à eux de représenter des graphes. Nous nous sommes particulièrement intéressés aux techniques de placement, de filtrage et de codage graphique applicables à ces diagrammes. Nous avons conçu une librairie de visualisation de graphes qui nous a permis d’évaluer les propriétés de différents modèles de force, tels que les standards de Fruchterman-Reingold et d’Eades, ou les modèles de clustering visuel de Noack. Nous avons développé des algorithmes de filtrage dans le but d’améliorer la lisibilité des représentations tout en contrôlant la quantité d’information perdue. Le codage graphique est l’utilisation des différents variables graphiques, telles que couleur, taille et forme, pour représenter des attributs des données. Son paramétrage permet à l’utilisateur de faire émerger ses objets d’intérêt au sein de la visualisation. L’association de ces méthodes nous permet de créer des visualisations interactives et paramétrables particulièrement utiles à l’exploration et à l’analyse visuelle de différents graphes complexes réels, tels que des réseaux de pages Web, de données bibliographiques et documentaires