Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title SPARQL-ML: Knowledge Discovery for the Semantic Web
Organization Unit
Authors
  • André Locher
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2007
Abstract Text Machine learning as well as data mining has been successfully applied to automatically or semiautomatically create Semantic Web data from plain data. Only little work has been done so far to explore the possibilities of machine learning to induce models from existing Semantic Web data. The interlinked structure of Semantic Web data allows to include relations between entities in addition to attributes of entities of propositional data mining techniques. It is, therefore, a perfect match for Statistical Relational Learning methods (SRL), which combine relational learning with statistics and probability theory. This thesis presents SPARQL-ML, a novel approach to perform data mining tasks for knowledge discovery in the SemanticWeb. Our approach is based on SPARQL and allows the use of statistical relational learning methods, such as Relational Probability Trees and Relational Bayesian Classifiers, as well as traditional propositional learning methods. We perform different experiments to evaluate our approach on synthetic and real-world datasets. The results show that SPARQL-ML is able to successfully combine statistical induction and logic deduction.
Zusammenfassung Schon heute wird Machine Learning und Data Mining erfolgreich für das automatische und semi-automatische Erstellen von Semantic Web Daten eingesetzt. Vergleichsweise wenig wurden hingegen die Möglichkeiten des Machine Learnings in Bezug auf das Erlernen von Modellen existierender Semantic Web Daten erforscht. Durch die verkettete Struktur der Semantic Web Daten ist es möglich, neben propositionalen Attributen von Entitäten auch die Beziehungen zwischen diesen in das Data Mining einzubeziehen. Es sind also optimale Voraussetzungen für die Verwendung der Methoden des Statistical Relational Learnings gegeben, das das Lernen von Beziehungen mit Statistik und Wahrscheinlichkeitstheorie verknüpft. In der vorliegenden Arbeit wird SPARQL-ML vorgestellt, ein neuartiger Ansatz, um Data Mining auf Semantic Web Daten anzuwenden. Er basiert auf SPARQL und erm¨öglicht die Verwendung von Statistical Relational Learning Methoden wie beispielsweise Relational Probability Trees und Relational Bayesian Classifiers, aber auch traditionelle propositionale Lernmethoden. Zur Evaluation dieses Ansatzes wurden verschiedene Experimente mit künstlichen und realen Datensätzen durchgeführt. Die Resultate zeigen, dass SPARQL-ML die Vorteile statistischer Induktion und logischer Deduktion erfolgreich vereinen kann.
PDF File Download
Export BibTeX