Not logged in.

Contribution Details

Type Other Publication
Scope Discipline-based scholarship
Title Multiple linear regression in databases
Organization Unit
Authors
  • Sophie Leuenberger
Language
  • English
How Published
Date 2014
Abstract Text Multidimensional statistical models such as multiple linear regression models are usually computed outside a data base management system (DBMS). In this report, we study how a multiple linear regression model can be computed inside a DBMS. The concept of "summary matrices", which was introduced by Ordonez as a tool to compute statistical models inside a DBMS, is presented and adapted for the case of multiple linear regression. We will consider two different approaches of implementation, study the performance of both of the alternatives, and figure out which one is better suited in which situation.
Zusammenfassung Multidimensionale statistische Modelle werden gewöhnlich ausserhalb eines Datenbankmanagementsystems (DBMS) berechnet. In diesem Bericht untersuchen wir, wie man ein multiples lineares Regressionsmodell innerhalb eines DBMS berechnen kann. Das Konzept von "summary matrices", das von Ordonez als Werkzeug zur Berechnung von statistischen Modellen in Datenbanken eingeführt wurde, wird vorgestellt und für das Problem der linearen Regression angepasst. Wir werden zwei verschiedene Varianten der Implementierung betrachten, deren Leistung analysieren und erläutern, welche Variante in welcher Situation besser geeignet ist.
PDF File Download
Export BibTeX