Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Optimization strategies for RDFS-aware data storage
Organization Unit
Authors
  • Michael Imhof
Supervisors
  • Cathrin Weiss
  • Abraham Bernstein
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2009
Abstract Text Indexing and storing triple-based Semantic Web data in a way to allow for efficient query processing has long been a difficult task. A recent approach to address this issue is the index- ing scheme Hexastore. In this work, we propose two novel on-disk storage models for Hexastore, that use RDF Schema information to gather data that semantically belong together and store them contiguously. In the clustering approach, elements of the same classes are stored contiguously within the indices. In the subindex approach, data of the same categories are saved in separate subindices. Thus, we expect to simplify and accelerate the retrieving process of Hexastore. The experimental evaluation shows a clear advantage of the standard storage model against the pro- posed approaches in terms of index creation time and required disk space.
Zusammenfassung Tripel-basierte Semantic Web Daten auf eine Art zu indexieren und zu speichern, die ein effizientes Abarbeiten von Queries ermöglicht, war lange eine schwierige Aufgabe. Ein neuer Ansatz, welcher dieser Schwierigkeit begegnet, ist das Indexierungsschema Hexastore. In dieser Arbeit schlagen wir zwei neue on-disk Speichermodelle für Hexastore vor, welche RDF Schema Informationen verwenden, umsemantisch zusammengehörige Daten zu sammeln und nahe beieinander zu speichern. Im Clustering Modell werden Elemente derselben Klasse innerhalb der Indizes benachbart gespeichert. Im Subindex Ansatz werden Daten derselben Kategorie in separaten Subindizes abgelegt. Dadurch erhoffen wir uns, den Retrieving Prozess zu vereinfachen und zu beschleunigen. Die experimentelle Auswertung zeigt einen klaren Vorteil des Standard Speichermodells gegenüber den vorgeschlagenen Ansätzen hinsichtlich der Index-Erstellungszeit und des benötigen Speicherplatzes.
Export BibTeX