Not logged in.

Contribution Details

Type Dissertation
Scope Discipline-based scholarship
Title Interval-Dependent Attributes in Relational Database Systems
Organization Unit
Authors
  • Anton Dignös
Supervisors
  • Michael Hanspeter Böhlen
  • Christian S Jensen
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 131
Date 2014
Abstract Text Data with time intervals is prominently present in finance, accounting, medicine and many other application domains. When querying such data, it is important to perform operations on aligned intervals, i.e., data is processed together only for the common interval where it is valid in the real world. For instance, an employee contributed to a project only for the time period where both the project was running and the employee was employed by the company, i.e., the employee contributed to the project only over their aligned time interval. A temporal join is thus only evaluated over the aligned interval of an employee and a project. The problem of performing temporal operations, such as temporal aggregation or temporal joins, on data with time intervals using relational database systems can be attributed to the lack of primitives for the alignment of intervals. Even more challenges arise, when the data includes attribute values that are interval-dependent, such as project budgets or cumulative costs, and need to be scaled along with the alignment of intervals during processing. The goal of this thesis is to provide systematic and built-in support for querying data with intervals in relational database systems. The solution we propose uses two temporal primitives a temporal normalizer and a temporal aligner for the alignment of intervals. Temporal operators on interval data are defined by reduction rules that map a temporal operator to an operation with a temporal primitive followed by the corresponding traditional non-temporal operator that uses equality on aligned intervals. A key feature of our approach is that operators can access the original time intervals in predicates and functions, such as join conditions and aggregation functions, using timestamp propagation. Our approach, through timestamp propagation, supports the scaling of attribute values that are interval-dependent. When intervals are aligned during query processing, scaling can be performed at query time with the help of user-defined functions. This allows users to choose whether and how attribute values should be scaled. This is necessary since they may be interested in the total value in one query and the scaled value according to days or even working days in another query. We integrated our solution into the kernel of the open source database system PostgreSQL, which allows to leverage existing query optimization techniques and algorithms.
Zusammenfassung Daten mit Zeitintervallen spielen eine wesentliche Rolle in der Buchhaltung, Finanzwirtschaft und Medizin, sowie in vielen anderen Bereichen. Um solche Daten abzufragen, ist es wichtig Operationen über angeglichenen Zeitintervallen auszuführen, damit Daten nur über das Zeitintervall verarbeitet werden, in dem sie auch gültig sind. Zum Beispiel kann ein Angestellter an einem Projekt nur über jenen Zeitraum gearbeitet haben, für welchen beide, das Projekt und die Anstellung gültig waren, d.h. ein Angestellter trägt zu einem Projekt nur über das angeglichene gemeinsame Zeitintervall bei. Ein temporaler Join wird deshalb nur über das angeglichene Zeitintervall verarbeitet. Das Problem bei der Verarbeitung temporaler Operationen in relationalen Datenbanken, wie z.B. temporale Aggregation oder temporaler Join, über Daten mit Zeitintervallen liegt an der unzureichenden Unterstützung von Primitiven für das Angleichen von Zeitintervallen. Eine daraus resultierende Herausforderung sind Daten mit Attributwerten, welche vom Zeitintervall abhängig sind, wie z.B. Projektbudgets oder kumulative Kosten, und aufgrund des Angleichens der Zeitintervalle, von den alten auf die neuen Zeitintervalle skaliert werden müssen. Die Zielsetzung dieser Dissertation ist es, eine systematische Unterstützung für Abfragen über Daten mit Zeitintervallen in den Kern von relationalen Datenbanken zu integrieren. Unsere Lösung verwendet zwei temporale Primitiven, einen temporal normalizer und einen temporal aligner, um Zeitintervalle anzugleichen. Temporale Operatoren für Daten mit Zeitintervallen sind durch reduction rules definiert, welche einen temporalen Operator auf eine temporale Primitive, gefolgt von einem herkömmlichen Datenbank Operator, reduzieren. Ein besonderes Merkmal unseres Ansatzes ist, dass Prädikate und Funktionen von temporalen Operatoren mit Hilfe von timestamp propagation auf die originalen Zeitintervalle von Tupeln zugreifen können, wie z.B. in Joinprädikaten und Aggregatsfunktionen. Zusätzlich unterstützt unser Ansatz, mit Hilfe von timestamp propagation, das Skalieren von Attributwerten, welche vom Zeitintervall abhängig sind. Wenn ein Intervall bei der Verarbeitung angeglichen wird, kann die Skalierung mit Hilfe von benutzerdefinierten Funktionen zur Laufzeit einer Abfrage durchgeführt werden. Dies ermöglicht den Benutzern zu entscheiden, wann und wie Attributwerte skaliert werden sollen. Diese Eigenschaft ist notwendig, da Benutzer in manchen Abfragen den gesamten Wert und in anderen Abfragen den skalierten Wert anhand von Tagen oder Arbeitstagen haben möchten. Wir haben unsere Lösung in das Open Source Datenbanksystem PostgreSQL integriert, was uns erlaubt, bereits existierende Anfrageoptimierungen und Algorithmen wiederzuverwenden.
Other Identification Number merlin-id:11568
PDF File Download from ZORA
Export BibTeX
EP3 XML (ZORA)