Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Predicting Human Error in Geolocation Tasks Using Online Metadata - An Exploratory Study
Organization Unit
Authors
  • Laura Salathe
Supervisors
  • Leonore Röseler
  • Ingo Scholtes
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2022
Abstract Text This thesis addresses the problem of predicting human errors in image geolocation tasks with the help of collected metadata. For this purpose, an interactive experiment architecture allowing the collection of mouse coordinates, clicking events, timestamps, and further human interaction data was designed. One hundred participants took part in the experiment and solved various geolocation tasks. The collected data was used to train different machine learning classifiers, such as logistic regression models, k-nearest neighbors, and support vector machines. The best-performing model is able to predict human errors in geolocation tasks to a small extent. The test accuracy on unseen test data is 10% higher than random chance and 4% better than the most simple rule-based model classifying all answers as correct.
Zusammenfassung Diese Arbeit befasst sich mit dem Problem der Vorhersage menschlicher Fehler bei der Geolokalisierung von Bildern mit Hilfe von gesammelten Metadaten. Zu diesem Zweck wurde ein interaktives Experimentdesign entworfen, das die Erfassung von Mauskoordinaten, Klicks, Zeitstempeln und weiteren Daten zur menschlichen Interaktion ermöglicht. Hundert Teilnehmende partizipierten am Experiment und lösten verschiedene Geolokalisierungsaufgaben. Die gesammelten Daten wurden verwendet, um verschiedene Machine Learning Modelle zu trainieren. Angewandt wurden: Logistische Regression, Nächste-Nachbarn-Klassifikation und Support-Vector-Maschinen. Das leistungsstärkste Modell konnte menschliche Fehler bei Geolokalisierungsaufgaben in geringem Umfang vorhersagen. Die Testgenauigkeit bei ungesehenen Testdaten ist 10% höher als der Zufall und 4% besser als ein einfaches Modell, das allen Beobachtungen die häufigste Bezeichnung zuweist.
PDF File Download
Export BibTeX