Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title Publication of linked data streams on the Web
Organization Unit
Authors
  • Elias Bernhaut
Supervisors
  • Daniele Dell' Aglio
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Number of Pages 66
Date August 2018
Abstract Text The access to information is an important factor for making informed choices, for example in the context of votings or business decisions. Free information is published on the Web as Open Data including free datasets published by governments. The so called Open Government Data (OGD) empowers the citizens with the access to information and builds the basis for new applications using government data as datasource. Parallel to the Open Data movement, the Semantic Web expands the global graph of Open Linked Data building the Linked Open Data Cloud (LOV). Linked Data comes with the advantage of globally identifiable entities interlinked through relationships. Applications with access to the Web are able to access the graph of the LOV for the retrieval of information from various sources. Linked Open Data datasets are majorly published as static datasets which means they don't change over time in contrast to dynamic datasets. An ongoing research has the goal to publish dynamic datasets as data streams. A notable example for a framework approaching the publication of Linked Data as data streams is TripleWave. It can interlink streamed input data and thus transform it to Linked Data streams. As TripleWave can transform streamed input data, it is missing the ability to transform static datasets which are updated frequently into Linked Data streams. Throughout this thesis, I analyse the OGD datasets and identify the requirements for their publication as Linked Open Data streams which are not yet covered by TripleWave. I show that no existing mapping language fulfills the requirements for the publication of the OGD datasets. A new mapping language is therefore necessary and thus I introduce a new, RML oriented mapping module named JRML. JRML is a Javascript module for data mappings to Linked Data with an integrated, pull-based data-fetching strategy controlled by a scheduler. I show how JRML meets the requirements for transforming the OGD datasets of the survey, how I implement JRML and how I integrate it into TripleWave. Finally I publish a range of transformed datasets to present the result and thus increase the number of Linked Open Data streams on the web.
Zusammenfassung Der Zugang zu Informationen ist ein wichtiger Faktor für fundierte Entscheidungen, sei es im Rahmen von Abstimmungen oder auch Geschäftsentscheidungen.Open Data ist der Baustein für die Veröffentlichung von Informationen, einschliesslich Datensätzen, die von Regierungen veröffentlicht werden. Open Government Data (OGD) ermöglicht Bürgern den Zugang zu Informationen und bildet die Grundlage für neue Applikationen, welche Regierungsdaten als Datenquelle nutzen. Parallel zur Open Data Bewegung erweitert das Semantic Web den globalen Open Linked Data Graphen zum Aufbau der Linked Open Data Cloud (LOV). Linked Data bietet den Vorteil global identifizierbarer Einheiten, die durch Beziehungen miteinander verbunden sind. Anwendungen mit Zugang zum Web können auf den Graphen der LOV zugreifen, um Informationen aus verschiedenen Quellen abzurufen. TripleWave ist ein Framework für die Veröffentlichung von Linked Data als Datenströme im Gegensatz zu statischen Datensätzen. Es kann gestreamte Eingangsdaten miteinander verknüpfen und so in global verknüpfte Datenströme umwandeln. Da TripleWave gestreamte Eingangsdaten transformieren kann, fehlt die Möglichkeit, statische Datensätze, die häufig aktualisiert werden, in verknüpfte Datenströme zu transformieren. In dieser Arbeit analysiere ich die Anforderungen an eine tragfähige Lösung und wähle eine Mapping-Sprache mit Hilfe der Untersuchung von OGD-Datensätzen, welche die Grundlage für die Auswertung bilden. Ich zeige, dass keine vorhandene Mapping-Sprache die Anforderungen erfüllt. Eine neue Mapping-Sprache ist daher notwendig und so stelle ich ein neues, an der Mapping-Sprache RML orientiertes Mapping-Modul namens JRML vor. JRML ist ein Javascript-Modul für Datenmappings zu Linked Data mit einer integrierten, Pull-basierten Datenabrufstrategie, die von einem Scheduler gesteuert wird. Ich zeige, wie JRML die Anforderungen für die Transformation der OGD-Datensätze der Umfrage erfüllt, wie ich JRML implementiere und in TripleWave integriere. Schliesslich veröffentliche ich eine Reihe von transformierten Datensätzen, um das Ergebnis zu präsentieren und damit die Anzahl der Linked Open Data Streams im Web zu erhöhen.
PDF File Download
Export BibTeX