Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title KroneDB: Compressing and Querying Time Series Data using the Kronecker Decomposition
Organization Unit
Authors
  • Thomas Mannhart
Supervisors
  • Dan Olteanu
  • Johannes Marti
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2023
Abstract Text This thesis introduces the design of KroneDB, a system for compressing time series data using the Kronecker decomposition, while allowing for efficient evaluation of relational queries including selection, projection, join, and aggregates (SPJA). KroneDB allows for a tunable trade-off between compression ratio and approximation error, while exploiting periodic patterns within the data to improve the compression. The compressed data can be queried directly without prior decompression while reducing the runtime of most queries. Updates can be applied directly to the compressed data and naturally enable value imputation and outlier detection in the updating process. By embedding our approach into the Functional Aggregate Queries (FAQ) framework, we show that it can be applied to a wide range of fundamental problems.
Zusammenfassung Diese Arbeit präsentiert KroneDB, ein System zur Komprimierung von Zeitreihendaten unter Verwendung der Kronecker Decomposition. Es unterstützt dabei die effiziente Auswertung von relationalen Queries, welche Selection, Projection, Joins und Aggregates (SPJA) beinhalten können. Das Verhältnis zwischen Kompressionsrate und Approximationsfehler kann den Anforderungen entsprechend angepasst werden. Dabei werden periodische Muster in den Daten genutzt, um die Kompression zu verbessern. Queries können direkt auf den komprimierten Daten ausgeführt werden. Die Laufzeit ist dabei in der Regel kürzer als auf den unkomprimierten Daten. Updates lassen sich direkt auf die komprimierten Daten anwenden, wobei zusätzlich fehlende Werte ergänzt und Ausreisser erkannt werden. Das Einbetten unseres Ansatzes in das Functional Aggregate Queries (FAQ) Framework zeigt das Potential für eine Vielzahl weiterer Anwendungen auf.
PDF File Download
Export BibTeX