Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title The Fundamentals of iSPARQL
Organization Unit
Authors
  • Markus Stocker
Supervisors
  • Abraham Bernstein
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2006
Abstract Text The growing amount of semantically annotated data and published ontologies opens an interesting and challenging application for similarity measures. In face of limited knowledge about the distributed data on the SemanticWeb, similarity measures allow a retrieval which is expected to improve the performance compared to exact querying. This thesis presents iSPARQL, an extension to SPARQL which allows querying for similar resources in both RDF/RDFS and OWL ontologies, and supports the development of strategies to compute the similarity of ontological resources. Huge data volume forced the development of query optimization techniques for relational database systems. However, query engines for ontological data based on graph models, mostly execute user queries without considering any optimization. Especially for large ontologies, optimization techniques are required to ensure that query results can be delivered within reasonable time. OptARQ is a first prototype for iSPARQL query optimization based on the concept of triple pattern selectivity estimation. The evaluation we conduct demonstrates how triple pattern reordering according to their selectivity affects the query execution performance.
Zusammenfassung Die wachsende Menge semantisch annotierter Daten und verfügbaren Ontologien schaffen eine Basis für interessante und herausfordende Anwendungen für Ähnlichkeitsmasse. Bei fehlendem Wissen über die auf dem Semantic Web verteilten Informationen, ermöglichen Ähnlichkeitsmasse eine Suche, die erwartungsgemäss leistungsstärker sein dürfte, als die für exakte Suchsysteme. Diese Diplomarbeit stellt iSPARQL vor, eine SPARQL Erweiterung, die es ermöglicht, nach ähnlichen Ressourcen sowohl in RDF/RDFS als auch in OWL Ontologien zu suchen. Weiter unterstützt iSPARQL die Entwicklung von Strategien, um die Ähnlichkeit zwischen Ressourcen in Ontologien zu berechnen. Grosse Datenmengen führten bei relationalen Datenbanksystemen schon seit längerem zur Entwicklung verschiedener Optimierungstechniken. Systeme für Datenmodelle, die auf Graphen basieren, führen die Anfrage hingegen meist ohne Optimierungen durch. Speziell für grosse Ontologien sind Optimierungstechniken entscheidend, um die Resultate in nützlicher Zeit zu ermitteln. OptARQ ist ein erster Prototyp für iSPARQL Optimierung, der die Selektivität von Triple Patterns berücksichtigt. Die durchgeführte Evaluation zeigt, wie eine Ordnung der Triple Patterns gemäss deren Selektivität die Geschwindigkeit der Anfragen massiv verbesseren kann.
Export BibTeX