Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title Data lineage and meta data analysis in data warehouse environments
Organization Unit
Authors
  • Martin Noack
Supervisors
  • Michael Hanspeter Böhlen
  • D. Christopeit
  • C. Jossen
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 56
Date 2013
Abstract Text This thesis aims to provide new insights on data lineage computations within the Credit Suisse data warehouse environment. We propose a system to compute the lineage, targeted at business users without technical knowledge about IT systems. Therefore we provide complete abstraction for end users. Furthermore, we process only conceptual mapping rules from the metadata warehouse, in contrast to other approaches which record transformations at runtime, and consequently do not rely on access to potentially sensitive data. In order to process mapping rules, we developed an algorithm that is capable of extracting components generically, based on their semantic meaning and relation to each other. This thesis describes some patterns in lineage investigations that result from our approach and gives an outlook to future projects that could be based on this work.
Zusammenfassung Diese Arbeit erläutert unsere Erkenntnisse bezüglich der Berechnung von Data Lineage im Bereich des Data Warehouse der Credit Suisse. Hierzu stellen wir eine Methode vor, um Data Lineage für Business Anwender zu errechnen, welche keine tieferen Kenntnisse bezüglich der IT Systeme besitzen. Dem Benutzer wird mittels des vorgestellten Ansatzes vollständige Transparenz und Abstraktion vom technischen Problem ermöglicht. Wir benutzen lediglich die konzeptionellen Abbildungsvorschriften in Mappings aus dem MetadataWarehouse, wohingegen andere Ansätze die Abbildungen zur Laufzeit aufzeichnen. Daher sind wir nicht auf den Zugriff auf potentiell vertrauliche Daten angewiesen. Um die Mapping Regeln auszuwerten, benutzen wir einen Algorithmus, der generisch Komponenten aus Mappings ausliest. Dabei werden sowohl die semantische Bedeutung der Komponenten, als auch deren Beziehung zueinander berücksichtigt. Weiterhin beschreiben wir in dieser Arbeit Muster in der Lineage Berechnung, die sich aus unserem Ansatz ergeben, und bieten ein Ausblick auf zukünftige Projekte basierend auf unseren Erkenntnissen.
PDF File Download
Export BibTeX