Not logged in.

Quick Search - Contribution

Contribution Details

Type	Bachelor's Thesis
Scope	Discipline-based scholarship
Title	Towards Rotation Estimation from a Single Blurred Image using Deep Learning
Organization Unit	Robotics and Perception Group (Davide Scaramuzza)
Authors	Patrick Widmer
Supervisors	Zichao Zhang Antonio Loquercio Davide Scaramuzza
Language	English
Institution	University of Zurich
Faculty	Faculty of Business, Economics and Informatics
Date	2017
Abstract Text	Visual ego-motion estimation for autonomous robots has developed significantly and become mature during the past few years. However, if the images from the cameras contain motion blur, reliable state estimation is still challenging. Recently, learning-based approaches have achieved great success in dealing with motion blur. Therefore, in this thesis, we explore learning-based methods on several problems related to visual ego-motion estimation from a single blurred image. In particular, we find that classifying the rotation axis from a fixed set of axes using a small CNN works well. Otherwise, we find that estimating the rotation axis and angle at the same time without restricting the axes is more difficult, even for a pretrained deep CNN. We compare different approaches for solving this problem. We implement a data generation pipeline using Blender and use the simulated images and ground truth to train the CNNs.
Zusammenfassung	Das visuelle Erkennen der Eigenbewegung von autonomen Robotern wird immer öfter eingesetzt. Wenn jedoch die Kameraaufnahmen verschwommen sind, ist eine genaue Bestimmung der Position und Ausrichtung des Roboters anspruchsvoll. Jüngst wurden mit dem Einsatz von Neuralen Netzen im Umgang mit verschwommenen Bildern immer bessere Resultate erzielt. In dieser Arbeit geht es um den Einsatz von Neuralen Netzen für die visuelle Erkennung der Eigenbewegung von Flugrobotern aus einzelnen verschwommenen Bildern. Wir erzielen gute Resultate im Vorhersagen der Rotationsachse aus einer gegebenen Menge von Achsen. Wir haben jedoch Schwierigkeiten die Rotationsachse und den -winkel gleichzeitig vorherzusagen, wenn wir die möglichen Achsen nicht limitieren, dies gilt auch für ein komplexes, zuvor trainiertes Neurales Netz. Wir vergleichen verschiedene Ansätze dieses Problem zu lösen. Wir haben ein automatisiertes Vorgehen entwickelt, das mit Blender verschwommene Bilder mit der entsprechenden Kamerabewegung erzeugt. Mit diesen Bildern und der Information über die Kamerabewegung trainieren wir die Netzwerke.
PDF File	Download
Export	BibTeX