Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Automatic Knowledge Graph Creation from Text: A Field Study
Organization Unit
Authors
  • Roman Alexander Kahr
Supervisors
  • Abraham Bernstein
  • Matthias Baumgartner
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2020
Abstract Text Open Information Extraction is the process of extracting domain-independent triples from natural language text. This thesis assesses the performance of Open Information Extraction in real-life scenarios by comparing two state-of-the-art algorithms, namely Supervised-oie and Open IE 5.0, against each other and assesses how their reported performance di ers from the one achieved on a real-life business corpus. The performance is measured with regards to precision, recall and runtime. The results suggest that there is a gap between the reported results and the ones achieved on the business corpus. Finally, an in-depth error assessment of the algorithms is conducted to suggest solutions to mitigate these errors and maximize both precision and recall.
Zusammenfassung Open Information Extraction ist ein Prozess, welcher strukturierte Daten in Form sogenannter ìTriplesî aus unstrukturierten Texten extrahiert. Die vorliegende Masterthesis befasst sich mit der Umsetzung des genannten Prozesses innerhalb eines realen Gesch‰ftsumfeldes. Dabei werden zwei Algorithmen, Supervised-oie und Open Information Extraction 5.0 implementiert und im Anschluss verglichen. Ziel der Studie ist es zu ermitteln, inwiefern die Resultate aus dem real existierenden Datensatz mit jenen von literarischen Ursprung vergleichbar sind. Die Analysen zeigen auf, dass eine Diskrepanz zwischen den Resultaten besteht und die Algorithmen auf realen Daten nicht diesselbe Leistung erzielen. Abschliessend wird eine detalierte Fehleranalyse erstellt und daneben Lˆsungen vorgestellt, damit die Resultate verbessert werden kˆnnen.
PDF File Download
Export BibTeX