Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title An Adaptive Index for Hierarchical Database Systems
Organization Unit
Authors
  • Rafael Kallis
Supervisors
  • Michael Hanspeter Böhlen
  • Kevin Wellenzohn
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2018
Abstract Text The workload-aware property index is a hierarchical index which adapts to the database's recent transactional workload by not pruning volatile index nodes, i.e. nodes which are frequently inserted or deleted, in order to increase update performance. When the workload changes, these nodes cease to be volatile and become unproductive if they and their descendants, neither contribute to a query match, nor are volatile. Unproductive nodes in hierarchical indexes waste space and slow down queries. We propose periodic Garbage Collection and Query-Time Pruning in order to clean unproductive nodes in the index. We implement the techniques in Apache Jackrabbit Oak and provide an extensive experimental evaluation to stress test the algorithms and show that the database throughput increases considerably when periodic Garbage Collection or Query-Time Pruning are applied.
Zusammenfassung Der "workload-aware property index" ist ein hierarchischer Index, der sich an die jüngste Transaktionslast der Datenbank anpasst, indem er volatile Indexknoten (d.h. Knoten die häufig eingefügt oder gelöscht werden) nicht löscht um die Schreibleistung zu erhöhen. Wenn sich die Arbeitslast ändert, sind diese Knoten nicht mehr volatil und werden unproduktiv, falls sie und ihre Nachkommen weder zu einer Abfrage beitragen noch volatil sind. Unproduktive Knoten in hierarchischen Indizes verschwenden Speicherplatz und verlangsamen die Abfragen. Wir schlagen periodische Indexreinigung und Abfragezeitbereinigung vor, um den Index von unproduktiven Knoten zu bereinigen. Wir implementieren unsere Techniken in Apache Jackrabbit Oak und bieten eine umfangreiche experimentelle Auswertung, um die Algorithmen unter hoher Last zu testen und zeigen, dass der Datenbankdurchsatz erheblich zunimmt, wenn periodische Indexreinigung oder Abfragezeitbereinigung benutzt werden.
PDF File Download
Export BibTeX