Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Transitioning between Data and Schema Values in MonetDB
Organization Unit
Authors
  • Alphonse Mariyagnanaseelan
Supervisors
  • Michael Hanspeter Böhlen
  • Oksana Dolmatova
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2021
Abstract Text In the past we have introduced the relational matrix algebra, in order to process and analyze scientific data directly in the DBMS, where the data is stored. Some relational matrix operations turn the data values of an input relation to the attribute name of their result relation. An example is the transpose operation, which uses the values of one of its input columns to form the schema of its output relation. The actual data stored in columns becomes available only during query execution. This is an issue, since the number and the names of attributes is essential information when creating query trees in column oriented DBMS. In this thesis we suggest a solution which encapsulates these unknown attributes in the query trees. We explain how an attribute specified in a query, that refers to one of the unknown attributes, can be resolved. Further, we describe the implementation of this concept in MonetDB. We propose functions, with which these encapsulated columns can be processed, so that they become compatible with the existing infrastructure. In the evaluation we observe that most relational operations can work with input relations, where the schema is unknown, when they make use of our extensions. In the experimental evaluation we test the performance of the proposed solution.
Zusammenfassung In der Vergangenheit haben wir die relationale Matrix Algebra eingeführt, um die Verarbeitung und Auswertung wissenschaftlicher Daten direkt auf der Datenbank, auf der sie gespeichert sind, durchzuführen. Einige relationale Matrix Operationen verwenden die Daten einer Input-Relation um die Attribute der Rückgabe-Relation zu benennen. Ein Beispiel dafür ist die Transponierung, welche die Werte eines ihrer Input-Spalten verwendet um das Relationenschema der Output-Relation zu bilden. Die tatsächlichen Daten in den Spalten werden erst bei der Auswertung der Datenbankabfrage verfügbar. Dies ist ein Problem, denn die Anzahl und die Namen der Attribute sind essenzielle Informationen, um Query-Trees in einer Spaltenorientierten Datenbank zu formulieren. In dieser Thesis stellen wir eine Lösung vor, welche diese unbekannten Attribute in den Query-Trees einkapselt. Wir erklären, wie ein in einer Anfrage spezifiziertes Attribut, welches sich auf ein unbekanntes Attribut bezieht, korrekt zugeordnet werden kann. Ferner beschreiben wir die Implementation dieses Konzepts in MonetDB. Wir schlagen Funktionen vor, womit die eingekapselten unbekannten Attribute verarbeitet werden können, sodass sie mit der vorhandenen Infrastruktur kompatibel werden. In der Evaluierung beobachten wir, dass die meisten relationalen Operationen mit Input-Relationen zurechtkommen, welche ein unbekanntes Relationenschema haben, wenn sie von unseren Erweiterungen Gebrauch machen. In der experimentellen Evaluation testen wir die Leistung der vorgeschlagenen Lösung.
PDF File Download
Export BibTeX