Not logged in.

Quick Search - Contribution

Contribution Details

Type	Master's Thesis
Scope	Discipline-based scholarship
Title	Extending Rdfbox with distributed RDF management: efficient RDF indexing and loading
Organization Unit	Dynamic and Distributed Information Systems (Abraham Bernstein)
Authors	Daniel Spicar
Supervisors	Abraham Bernstein
Language	English
Institution	University of Zurich
Faculty	Faculty of Economics, Business Administration and Information Technology
Number of Pages	80
Date	2013
Abstract Text	The Semantic Web is growing at a fast pace and single machines can reach the limits of their capabilities when trying to manage RDF data sets that contain billions of triples. In order to tackle this problem, this thesis extends Rdfbox, a Hexastore-based semantic database management system, with support for distributed index backends, a parallelised query execution engine and a distributed index loader. Evaluations show that the distributed index loader outperforms previous approaches and that the improved query execution engine is performance-critical with distributed and indices. But limits to the efficiency of distributed indices in Rdfbox are discovered that may require fundamental changes in the approach to query resolution in order to achieve a significant performance increase.
Zusammenfassung	Das Semantische Web (engl. Semantic Web) wächst ständig. RDF Datensätze erreichen Grössen von über einer Milliarde Tripel. Das Verwalten und Bereitstellen dieser Datensätze kann einzelne Computer an ihre Leistungsgrenzen bringen. Diese Arbeit erweitert Rdfbox, ein auf Hexastore basierendes semantisches Datenbankmanagementsystem, um die Unterstützung von verteilten Indexspeichern. Zusätzlich wurde eine parallele Anfrageauswertung und ein verteiltes System zum Einlesen von RDF-Graphen implementiert. Auswertungen zeigen, dass verteiltes Laden den vorherigen Lösungen weit überlegen ist und dass die parallele Anfrageauswertung für eine hohe Performanz der verteilten Indexstrukturen notwendig ist. Aber es wird ebenso deutlich, dass verteilte Indizes in Rdfbox nicht besonders effizient funktionieren können und es grundlegende Anpassungen in der Anfrageauswertung braucht, damit die Performanz deutlich erhöht werden kann.
PDF File	Download
Export	BibTeX