Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title A platform to integrate heterogeneous data
Organization Unit
Authors
  • Christoph Weber
Supervisors
  • Daniele Dell' Aglio
  • Abraham Bernstein
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2017
Abstract Text Heterogeneity is a very common and complex problem that arises in information systems. Gathering data from different data sources leads to data heterogeneity on a system, format, schematic and semantic level. The PigData Project aims to tackle the adoption of Big Data methods by the Swiss swine and pork production industry. Many actors in this supply chain collect data with overlapping targets but differing views and representation. To integrate this data for Big Data uses heterogeneity must be overcome. We elicit the stakeholder requirements for a data integration platform of the PigData Project and apply these requirements to a prototype. The scope of this data integration platform contains data upload over the web, integrating data into a common representation and allowing data analysts to execute queries on integrated data.
Zusammenfassung Heterogenität ist ein komplexes und weit verbreitetes Problem im Bereich von Informationssystemen. Das Sammeln von Daten aus verschiedenen Quellen führt zu Datenheterogenität auf System-, Format-, Schema- und Semantik-Ebene. Das Projekt PigData hat sich zum Ziel gesetzt, Big Data-Verfahren in der schweizerischen Industrie für Schweineproduktion einzuführen. Zahlreiche Akteure innerhalb der Produktionskette sammeln Daten zu überlappenden Zielobjekten aus verschiedenen Blickwinkeln und mit unterschiedlicher Repräsentation. Um diese Daten für Big Data-Verfahren integrieren zu können, muss die Heterogenität überwunden werden. Wir erheben die Anforderungen der Anspruchsgruppen für eine Datenintegrationsplattform für das PigData Projekt und wenden diese in einem Prototyp an. Die Datenintegrationsplattform umfasst das Hochladen von Daten über das Web, die Integration von Daten in eine gemeinsame Repräsentation und erlaubt Datenanalysten Abfragen auf integrierten Daten auszuführen.
PDF File Download
Export BibTeX