Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Evaluation of methods for automatic data linking
Organization Unit
Authors
  • Alexander Schäfer
Supervisors
  • Abraham Bernstein
  • Lorenz Fischer
  • Thomas Scharrenbach
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 66
Date 2012
Abstract Text The Semantic Web defines a way to publish data that is semantically linked to the World Wide Web. The advantages are that computer programs can follow these links and assemble data on their own, without human intervention but with human initiation. In the domain of statistics providing linked data would be a natural step towards open access to information. This thesis uses data from the Federal Statistics Office of Switzerland in a semi-automated process of semantically linking that data. Also four different tools with different methods for automatic matching of data were evaluated. It was found out, that for automated data linking in a manner acceptable for adoption, the raw data is not yet prepared enough, and the matching tools are not sufficiently developed.
Zusammenfassung Das Semantische Web definiert Formate um Daten semantisch verlinkt zu publizieren. Diese Daten können mit dem Wold Wide Web verbunden werden. Dadurch entstehen Vorteile bei Computerprogrammen, welche diese Verbindungen folgen können und Daten selbstständig zusammenstellen können, ohne menschliche Intervention aber mit menschlicher Initiation. In der statistischen Domäne ist das Bereitstellen von Linked Data eine natürliche Entwicklung hin zu einem offenem Zugang zu Informationen. Für diese Arbeit wurden öffentliche Daten vom Bundesamt für Statistik in einen semi-automatischen Verlinkungsprozess verwendet. Ausserdem wurden vier verschiedene Werkzeuge mit verschiedene Methoden des automatisch Datenabgleichs evaluiert. Es wurde festgestellt, dass für eine akzeptable automatisierte Verknüpfung der Daten, die Rohdaten noch nicht genug vorbereitet sind, und die entsprechenden Werkzeuge noch nicht ausreichend entwickelt sind.
Export BibTeX