Groupements d'objets multidimensionnels étendus avec un modèle de coût adaptatif aux requêtes

par Cristian-Augustin Saita

Thèse de doctorat en Informatique

Sous la direction de Philippe Pucheral.

Soutenue en 2006

à Versailles-St Quentin en Yvelines .


  • Résumé

    Nous proposons une méthode de groupement en clusters d'objets multidimensionnels étendus, basée sur un modèle de cout adaptatif aux requêtes, pour accélérer l'exécution des requêtes spatiales de type intervalle (e. G. , intersection, inclusion). Notre travail a été motivé par l'émergence de nombreuses applications de dissémination sélective d'informations posant de nouveaux défis au domaine de l'indexation multidimensionnelle. Dans ce contexte, les approches d'indexation existantes (e. G. , R-trees) ne sont pas adaptées aux besoins applicatifs tels que scalabilité (beaucoup d'objets avec des dimensions élevées et des extensions spatiales), performance de recherche (taux élevés de requêtes), performance de mise à jour (insertions et suppressions fréquentes d'objets) et adaptabilité (à la distribution des objets et des requêtes, et aux paramètres systèmes). Dans notre méthode, nous relâchons plusieurs propriétés spécifiques aux structures d'indexation arborescentes classiques (i. E. équilibrage de l'arbre et du partitionnement, englobement minimal des objets) en faveur d'une stratégie de groupement basée sur un modèle de coût adaptatif. Ce modèle de coût tient compte des caractéristiques de la plateforme d'exécution, de la distribution spatiale des objets et surtout de la distribution spatiale des requêtes. Plus précisément, la distribution des requêtes permet de déterminer les dimensions les plus sélectives et discriminantes à utiliser dans le regroupement des objets. Nous avons validé notre approche par des études expérimentales de performance impliquant de grandes collections d'objets et des requêtes d'intervalles avec des distributions uniformes et non-uniformes.

  • Titre traduit

    Cost-Based query-adaptative clustering for multidimensional objects with spatial extents


  • Résumé

    We propose a cost-based query-adaptive clustering solution for multidimensional objects with spatial extents to speed-up execution of spatial range queries (e. G. , intersection, containment). Our work was motivated by the emergence of many SDI applications (Selective Dissemination of Information) bringing out new real challenges for the multidimensional data indexing. Our clustering method aims to meet several application requirements such as scalability (many objects with many dimensions and with spatial extents), search performance (high rates of spatial range queries), update performance (frequent object insertions and deletions), and adaptability (to object and query distributions and to system parameters). In this context, the existing indexing solutions (e. G. , R-trees) do not efficiently cope with most of these requirements. Our object clustering drops many properties of classical tree-based indexing structures (tree height balance, balanced splits, minimum object bounding) in favor of a cost-based clustering strategy. The cost model takes into account the performance characteristics of the execution platform and relies on both data and query distributions to improve the average performance of spatial range queries. Our object clustering is based on grouping spatial objects with similar intervals (positions and extents) in a reduced subset of dimensions, namely the most selective and discriminatory ones relative to the query distribution. The practical relevance of our clustering approach was demonstrated by a series of experiments involving large collections of multidimensional spatial objects and spatial range queries with uniform and skewed distributions.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol.(vi-154 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 69 réf. Bibliogr. p. 149-154

Où se trouve cette thèse ?

  • Bibliothèque : Université de Versailles Saint-Quentin-en-Yvelines. Direction des Bibliothèques et de l'Information Scientifique et Technique-DBIST. Bibliothèque universitaire Sciences et techniques.
  • Disponible pour le PEB
  • Cote : 005.12 SAI
  • Bibliothèque : Université de Versailles Saint-Quentin-en-Yvelines. Direction des Bibliothèques et de l'Information Scientifique et Technique-DBIST. Bibliothèque universitaire Sciences et techniques.
  • Non disponible pour le PEB
  • Cote : T060007
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.