Towards privacy-preserving publication of continuous and dynamic : spatial indexing and bucketization approaches

par Adeel Anjum

Thèse de doctorat en Informatique et applications

Sous la direction de Marc Gelgon et de Guillaume Raschia.

Soutenue en 2013

à Nantes , en partenariat avec Université de Nantes. Faculté des sciences et des techniques (autre partenaire) .


  • Résumé

    La publication de données soucieuse du respect de la vie privée est au coeur des préoccupations des organisations qui souhaitent publier leurs données. Un nombre croissant d’entreprises et d’organismes collectent et publient des données à caractère personnel pour diverses raisons (études démographiques, recherche médicale,. . . ). Selon ces cas, celui qui publie les données fait face au dilemme suivant : comment permettre à un tiers l’analyse de ces données tout en évitant de divulguer des informations trop sensibles, relatives aux individus concernés? L’enjeu est donc la capacité à publier des jeux de données en maîtrisant ce risque de divulgation, c. A. D. De traiter l’opposition entre deux critères : d’un côté, on souhaite garantir la préservation de la confidentialité sur des données personnelles et, d’autre part, on souhaite préserver au maximum l’utilité du jeu de données pour ceux qui l’exploiteraient (notamment, des chercheurs). Dans ce travail, nous cherchons d’abord à élaborer plusieurs notions d’anonymisation des données selon plusieurs contextes. Nous montrons que les index spatiaux sont extrêmement efficaces dans le cadre de la publication de données, en raison de leur capacité à passer à l’échelle. Une évaluation empirique approfondie révèle qu’il est possible de diffuser des données de grande qualité et préservant un certain niveau de confidentialité dans les données. Il est de plus possible de traiter efficacement de très grands jeux de données en grandes dimensions et cette méthode peut être étendue à un niveau de confidentialité plus fort (differential privacy). Par ailleurs, la publication séquentielle de données (mise à jour du jeu de données) est cruciale dans un grand nombre d’applications. Nous proposons une technique menant à bien cette tâche, garantissant à la fois une forte confidentialité des données et une très bonne préservation de leur utilité.

  • Titre traduit

    Publication de données qui préservent la vie privée pour des données continues et dynamiques : les approches d’indexation spatiale et de Bucketisation


  • Pas de résumé disponible.


  • Résumé

    Privacy-Preserving Data Publishing (PPDP) has become a critical issue for companies and organizations that would release their data. Many organizations collect and distribute personal data for a variety of different purposes, including demographic and public health research. In these situations, the data distributor is often faced with a dilemma: how to publish this personal data for analysis purposes without endangering the privacy of the concerned individuals? Disseminating such information without the privacy scare is an important problem. On one hand, the data publishers need to protect the privacy of individuals and on the other hand, it is also extremely important to preserve the usefulness of the data for the researchers. In this dissertation, we mainly focus on crafting the notions of privacy in various settings. We show that spatial indexes are extremely efficient for data publication tasks due to their ability to scale up. An extensive empirical evaluation reveals that it is possible to disseminate high-quality data that follows meaningful notions of privacy. Furthermore, it is possible to do this efficiently for high dimensional very large data sets and this approach can be extended to stronger notions of privacy e. G. , differential privacy. Also, sequential data is being increasingly employed in a wide variety of applications and the publication of sequential data is of utmost importance for the betterment of these applications. We provide a bucketization-based approach to achieve a stronger privacy guarantee along with higher utility of final release

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (188 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliographie p. 177-186

Où se trouve cette thèse ?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. BU Sciences.
  • Disponible pour le PEB
  • Bibliothèque : Université de Nantes. Service commun de la documentation. BU Sciences.
  • Non disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.