Not logged in.

Quick Search - Contribution

Contribution Details

Type	Master's Thesis
Scope	Discipline-based scholarship
Title	Transitioning between Data and Schema Values in MonetDB
Organization Unit	Database Technology (Michael Hanspeter Böhlen)
Authors	Alphonse Mariyagnanaseelan
Supervisors	Michael Hanspeter Böhlen Oksana Dolmatova
Language	English
Institution	University of Zurich
Faculty	Faculty of Business, Economics and Informatics
Date	2021
Abstract Text	In the past we have introduced the relational matrix algebra, in order to process and analyze scientific data directly in the DBMS, where the data is stored. Some relational matrix operations turn the data values of an input relation to the attribute name of their result relation. An example is the transpose operation, which uses the values of one of its input columns to form the schema of its output relation. The actual data stored in columns becomes available only during query execution. This is an issue, since the number and the names of attributes is essential information when creating query trees in column oriented DBMS. In this thesis we suggest a solution which encapsulates these unknown attributes in the query trees. We explain how an attribute specified in a query, that refers to one of the unknown attributes, can be resolved. Further, we describe the implementation of this concept in MonetDB. We propose functions, with which these encapsulated columns can be processed, so that they become compatible with the existing infrastructure. In the evaluation we observe that most relational operations can work with input relations, where the schema is unknown, when they make use of our extensions. In the experimental evaluation we test the performance of the proposed solution.
Zusammenfassung	In der Vergangenheit haben wir die relationale Matrix Algebra eingeführt, um die Verarbeitung und Auswertung wissenschaftlicher Daten direkt auf der Datenbank, auf der sie gespeichert sind, durchzuführen. Einige relationale Matrix Operationen verwenden die Daten einer Input-Relation um die Attribute der Rückgabe-Relation zu benennen. Ein Beispiel dafür ist die Transponierung, welche die Werte eines ihrer Input-Spalten verwendet um das Relationenschema der Output-Relation zu bilden. Die tatsächlichen Daten in den Spalten werden erst bei der Auswertung der Datenbankabfrage verfügbar. Dies ist ein Problem, denn die Anzahl und die Namen der Attribute sind essenzielle Informationen, um Query-Trees in einer Spaltenorientierten Datenbank zu formulieren. In dieser Thesis stellen wir eine Lösung vor, welche diese unbekannten Attribute in den Query-Trees einkapselt. Wir erklären, wie ein in einer Anfrage spezifiziertes Attribut, welches sich auf ein unbekanntes Attribut bezieht, korrekt zugeordnet werden kann. Ferner beschreiben wir die Implementation dieses Konzepts in MonetDB. Wir schlagen Funktionen vor, womit die eingekapselten unbekannten Attribute verarbeitet werden können, sodass sie mit der vorhandenen Infrastruktur kompatibel werden. In der Evaluierung beobachten wir, dass die meisten relationalen Operationen mit Input-Relationen zurechtkommen, welche ein unbekanntes Relationenschema haben, wenn sie von unseren Erweiterungen Gebrauch machen. In der experimentellen Evaluation testen wir die Leistung der vorgeschlagenen Lösung.
PDF File	Download
Export	BibTeX