Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Data Augmentation for Improved Classification in Neural Networks
Organization Unit
Authors
  • Isabel Margolis
Supervisors
  • Manuel Günther
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2021
Abstract Text Image classification models are often trained on additional transformations of the original images to increase the number and the variance of the training set. These transformations can include, for example, horizontal flips, rotations, and color transformations. Most of the recent data augmentation methods focus on improving data augmentation techniques during the training phase. There is very little research on test-time augmentation, which contains data augmentation during the testing phase. Often, only very simple transformations are used during testing, and the predictions are frequently aggregated through simple averaging or majority voting. I propose new aggregation methods to improve the predictive performance of image classification models during the testing phase. I show on four different datasets, namely CIFAR-10, MNIST, ImageNet, and a dataset containing images for melanoma classification, that other aggregation methods, besides the commonly applied averaging and majority voting, obtain better results.
Zusammenfassung Um die Leistung von Bildklassifikationsmodellen zu verbessern, werden die Bilder beim Trainieren eines Modells oft durch verschiedene Transformationen vermehrt. So kann man die Anzahl und die Varianz der Bilder vergrössern, ohne zusätzliche Daten sammeln zu müssen. Solche Transformationen können zum Beispiel Rotationen, horizontale Verschiebungen und Farbveränderungen beinhalten. Oft führt dies zu besseren Ergebnissen und ist eine weit verbreitete Technik. Während die Augmentation der Bilder während der Trainingsphase bereits ausgiebig erforscht wurde, existieren nur wenige Arbeiten, die sich auf die Testphase beziehen. Oft werden nur sehr einfache Transformationen während dieser Phase angewendet und die gewonnenen Prognosen auf den Testbildern werden meistens durch Mittelwertbildung oder Mehrheitsentscheidung aggregiert. In dieser Arbeit zeige ich auf vier verschiedenen Datensätzen, CIFAR-10, MNIST, ImageNet und ein Datensatz mit Bildern zur Melanomklassifizierung, dass die Augmentation von Bildern während der Testphase verbesserte Resultate erbringen. Zusätzlich zeige ich, dass neue Methoden zur Aggregierung bessere Prognosen erzielen als die herkömmlichen Methoden.
PDF File Download
Export BibTeX