Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Extending Rdfbox with distributed RDF management: efficient RDF indexing and loading
Organization Unit
Authors
  • Daniel Spicar
Supervisors
  • Abraham Bernstein
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 80
Date 2013
Abstract Text The Semantic Web is growing at a fast pace and single machines can reach the limits of their capabilities when trying to manage RDF data sets that contain billions of triples. In order to tackle this problem, this thesis extends Rdfbox, a Hexastore-based semantic database management system, with support for distributed index backends, a parallelised query execution engine and a distributed index loader. Evaluations show that the distributed index loader outperforms previous approaches and that the improved query execution engine is performance-critical with distributed and indices. But limits to the efficiency of distributed indices in Rdfbox are discovered that may require fundamental changes in the approach to query resolution in order to achieve a significant performance increase.
Zusammenfassung Das Semantische Web (engl. Semantic Web) wächst ständig. RDF Datensätze erreichen Grössen von über einer Milliarde Tripel. Das Verwalten und Bereitstellen dieser Datensätze kann einzelne Computer an ihre Leistungsgrenzen bringen. Diese Arbeit erweitert Rdfbox, ein auf Hexastore basierendes semantisches Datenbankmanagementsystem, um die Unterstützung von verteilten Indexspeichern. Zusätzlich wurde eine parallele Anfrageauswertung und ein verteiltes System zum Einlesen von RDF-Graphen implementiert. Auswertungen zeigen, dass verteiltes Laden den vorherigen Lösungen weit überlegen ist und dass die parallele Anfrageauswertung für eine hohe Performanz der verteilten Indexstrukturen notwendig ist. Aber es wird ebenso deutlich, dass verteilte Indizes in Rdfbox nicht besonders effizient funktionieren können und es grundlegende Anpassungen in der Anfrageauswertung braucht, damit die Performanz deutlich erhöht werden kann.
PDF File Download
Export BibTeX