Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title A distributed engine for processing triple streams
Organization Unit
Authors
  • Thomas Hunziker
Supervisors
  • Abraham Bernstein
  • Lorenz Fischer
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 60
Date December 2012
Abstract Text The rate at which the data is produced overhaul the rate at which new storage capacity is produced [5]. To use all the created data it must be processed near realtime as data stream. In parallel the data is stored more and more in the sematic web, which allows the combination of data in new ways. This work shows an implementation with a horizontally scaling, which is capable to process triple stream data with the Storm framework. The work evaluates the system against data set of about 160 million triples with di erent number of machines and processors.
Zusammenfassung Die Geschwindigkeit mit der Daten produziert werden übersteigt die Geschwindigkeit mit der neuer Speicher produziert wird [5]. Um die erzeugten Daten nutzen zu können, müssen diese Daten in Echtzeit als Datenstreams verarbeitet werden. Parallel zu dieser Entwicklung werden die Daten immer mehr im semantischen Web gespeichert, dies erlaubt die Kombination der Daten in neuartiger Weise. Diese Arbeit zeigt eine Implementierung mit horizontaler Skalierung, die in der Lage ist Triple Datenstreams zu verarbeiten mit dem Storm Framework. Die Arbeit evaluiert das System gegen ein Datenset von 160 Millionen Triple mit einer unterschiedlichen Anzahl Maschinen und Prozessoren.
PDF File Download
Export BibTeX