Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Automated Extraction of Knowledge Graphs from Scholarly Publications using Data Mining and Machine Learning
Organization Unit
Authors
  • Luca Weibel
Supervisors
  • Ingo Scholtes
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2019
Abstract Text Extracting structured data from research papers provided in PDF form has been an ongoing endeavor. This thesis proposes a pipeline capable of taking research paper PDFs and inserting them into a knowledge graph. Developed to be modular and extensible, this pipeline enables new capabilities for scholarly information systems by including both the full-text of research papers as well as metadata provided from CrossRef. We also propose two research paper recommendation algorithms that leverage the proposed pipeline and a method of evaluating research paper recommendation algorithms via a hindcasting experiment that aims to predict the citations in a paper given the first few as input.
Zusammenfassung Die Extraktion strukturierter Daten aus Forschungsarbeiten, die in PDF-Form vorliegen, ist ein ständiges Bestreben. Diese Arbeit schlägt eine Pipeline vor, die in der Lage ist, PDFs von Forschungsarbeiten zu nehmen und sie in ein Wissensgraphen einzufügen. Diese als modular und erweiterbar entwickelte Pipeline ermöglicht neue Möglichkeiten für wissenschaftliche Informationssysteme, indem sie sowohl den Volltext von Forschungsarbeiten als auch Metadaten aus CrossRef enthält. Wir schlagen auch zwei Empfehlungsalgorithmen für Forschungsarbeiten vor, die die vorgeschlagene Pipeline nutzen, und eine Methode zur Bewertung von Empfehlungsalgorithmen für Forschungsarbeiten über ein Hindcasting-Experiment, das darauf abzielt, die Zitate in einem Papier vorherzusagen, das die ersten paar als Input enthält.
PDF File Download
Export BibTeX