Not logged in.

Contribution Details

Type Other Publication
Scope Discipline-based scholarship
Title Multiple linear regression in databases
Organization Unit
Authors
  • Markus Neumann
Language
  • English
How Published
Date 2014
Abstract Text Matrix operations have many applications in various fields of research and industry, where big datasets and relational database management systems prevail. Performing matrix operations inside a database can be expensive and therefore efficient algorithms are required. The MAD project provides a recent set of such algorithms from which I implemented the `ordinary least squares' algorithm that approximates the linear regression coefficient, as Facharbeit in the course of my minor at UZH. This work presents an introduction to linear regression, the issues with its application in a database system as well as the implementation details of the algorithm in PostgreSQL.
Zusammenfassung Matrizen sind weit verbreitet in verschiedenen Gebieten der Forschung und Industrie, wo riesige Datenmengen in relationalen Datenbanksystemen alltäglich sind. Die Berechnung von Matrizenoperationen innerhalb einer Datenbank kann sehr rechenintesiv sein, weshalb effiziente Algorithmen sehr gefragt sind. Das MAD Projekt bietet eine Sammlung solcher Algorithmen, von welchen ich die `Methode der kleinsten Quadrate', welche den linearen Regressionskoeffizienten approximiert, als Facharbeit im Nebenfach meines Studiums an der UZH implementiert habe. Diese Arbeit gibt eine Einführung in lineare Regression, ihre Einbindung in Datenbanksysteme, sowie die Details der Implementierung des Algorithmus in PostgreSQL.
PDF File Download
Export BibTeX