Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title Di erential Privacy Algorithms for Data Streams on Top of Apache Flink
Organization Unit
Authors
  • Laurenz Shi
Supervisors
  • Narges Ashena
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date January 2019
Abstract Text With the upcoming of computing systems that process large amounts of data, securing sensitive data has become a lasting concern. Research has shown that with the help of other data sets, anoynimzed data sets can be reconstructed. Differential privacy is a construct to secure sensitive data. The data is perturbed with noise to ensure privacy. Differential privacy has shown to be very effective against attempts to reconstruct anonymized data sets in combination with other data sets. Originally used on static data sets, differential privacy was extended to data streams. Four papers that introduce various algorithms are examined in this thesis. The algorithms are often of theoretical nature. To evaluate the real effects of the algorithms on the results of data streams, they are implemented and compared to each other. The focus is on the performance in terms of accuracy that the algorithms deliver.
Zusammenfassung Sensible Datensätze zu schützen ist ein fortwährendes Problem mit dem Aufkommen von Computer Systemen, welche grosse Mengen an Datensätzen verarbeiten. Eine Forschungsarbeit hat gezeigt, wie einfach anonymisierte Datensätze mit Hilfe von zusätzlichen Datensätzen entschlüsselt werden können. Differential Privacy ist ein Konstrukt zur Sicherung von sensiblen Daten bei Abfragen von Queries. Dabei werden die Daten gestört mit Hilfe von Lärm. Differential Privacy hat sich als äussert robust gezeigt gegen Versuche, durch das Kombinieren von verschiedenen Datensätzen, anonymisierte Daten zu entschlüsseln. Urpsrünglich angewendet auf statische Daten, wurde Differential Privacy erweitert auf Data Streams. Vier Artikel, die verschiedene Differential Privacy Algorithmen vorstellen, werden untersucht in dieser Bachelor Arbeit. Die Algorithmen sind meist theoretischer Natur. Um die realen Auswirkungen der Algorithmen auf Data Streams zu evaluieren, werden sie implementiert und danach verglichen miteinander. Der Fokus liegt dabei auf der Genauigkeit der Ergebnisse, die von den Algorithmen geliefert werden.
PDF File Download
Export BibTeX