Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title Towards Rotation Estimation from a Single Blurred Image using Deep Learning
Organization Unit
Authors
  • Patrick Widmer
Supervisors
  • Zichao Zhang
  • Antonio Loquercio
  • Davide Scaramuzza
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2017
Abstract Text Visual ego-motion estimation for autonomous robots has developed significantly and become mature during the past few years. However, if the images from the cameras contain motion blur, reliable state estimation is still challenging. Recently, learning-based approaches have achieved great success in dealing with motion blur. Therefore, in this thesis, we explore learning-based methods on several problems related to visual ego-motion estimation from a single blurred image. In particular, we find that classifying the rotation axis from a fixed set of axes using a small CNN works well. Otherwise, we find that estimating the rotation axis and angle at the same time without restricting the axes is more difficult, even for a pretrained deep CNN. We compare different approaches for solving this problem. We implement a data generation pipeline using Blender and use the simulated images and ground truth to train the CNNs.
Zusammenfassung Das visuelle Erkennen der Eigenbewegung von autonomen Robotern wird immer öfter eingesetzt. Wenn jedoch die Kameraaufnahmen verschwommen sind, ist eine genaue Bestimmung der Position und Ausrichtung des Roboters anspruchsvoll. Jüngst wurden mit dem Einsatz von Neuralen Netzen im Umgang mit verschwommenen Bildern immer bessere Resultate erzielt. In dieser Arbeit geht es um den Einsatz von Neuralen Netzen für die visuelle Erkennung der Eigenbewegung von Flugrobotern aus einzelnen verschwommenen Bildern. Wir erzielen gute Resultate im Vorhersagen der Rotationsachse aus einer gegebenen Menge von Achsen. Wir haben jedoch Schwierigkeiten die Rotationsachse und den -winkel gleichzeitig vorherzusagen, wenn wir die möglichen Achsen nicht limitieren, dies gilt auch für ein komplexes, zuvor trainiertes Neurales Netz. Wir vergleichen verschiedene Ansätze dieses Problem zu lösen. Wir haben ein automatisiertes Vorgehen entwickelt, das mit Blender verschwommene Bilder mit der entsprechenden Kamerabewegung erzeugt. Mit diesen Bildern und der Information über die Kamerabewegung trainieren wir die Netzwerke.
PDF File Download
Export BibTeX