Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title Quality estimation and provider selection mechanism
Organization Unit
Authors
  • András Heé
Supervisors
  • Abraham Bernstein
  • Mengia Zollinger
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 50
Date 2012
Abstract Text This paper documents the algorithms and key aspects of a Quality Estimation and Provider Selection Mechanism (QEPSM) for SPARQL endpoints. The prototype implements a mechanism that crawls the Web for SPARQL endpoints and then collects metadata about the data providers to estimate the quality of their provided data. This data quality is determined by an assessment of the data providers and their SPARQL endpoints using three different algorithms. They rank the reputation analysing the relationships between the datasets similar to Google’s PageRank, the availability of the SPARQL endpoints, the support of SPARQL functionalities and the quality of the used vocabularies. With this information the tool offers a list of data providers ordered by decreasing data quality, which can support other metrics to elicit an optimal allocation of federated queries. A web interface visualises the data and ranks.
Zusammenfassung Dieses Dokument beschreibt die Architektur und die Umsetzung eines Quality Estimation and Provider Selection Mechanism (QEPSM) für SPARQL Endpoints. Das Tool implementiert einen Crawler, welcher das Web nach SPARQL Endpoints absucht und danach mit Hilfe von zusätzlich gesammelten Metadaten die Qualität der Daten schätzt. Diese Qualität wird aufgrund einer Analyse des Datenanbieters und dessen SPARQL Endpoints anhand von drei verschiedenen Algorithmen ermittelt. Diese bewerten die Reputation anhand einer Analyse der Verbindungen zwischen den Datensätzen ähnlich wie der PageRank von Google, die Verfügbarkeit der SPARQL Endpoints, die Unterstützung von SPARQL Funktionen und die Qualität des gebrauchten Vokabulars. Mit diesen Informationen kann das Tool eine Liste mit Datenanbietern generieren, sortiert nachabsteigender Datenqualität. Diese erlaubt die Unterstu ̈tzung von anderen Metriken für eine optimale Anbieterzuweisung bei SPARQL Anfragen. Ein Webinterface bereitet die Daten grafisch auf und erlaubt einen schnellen Überblick über die Datenanbieter.
PDF File Download
Export BibTeX