Not logged in.

Quick Search - Contribution

Contribution Details

Type	Master's Thesis
Scope	Discipline-based scholarship
Title	Data Augmentation for Improved Classification in Neural Networks
Organization Unit	Artificial Intelligence and Machine Learning (Manuel Günther)
Authors	Isabel Margolis
Supervisors	Manuel Günther
Language	English
Institution	University of Zurich
Faculty	Faculty of Business, Economics and Informatics
Date	2021
Abstract Text	Image classification models are often trained on additional transformations of the original images to increase the number and the variance of the training set. These transformations can include, for example, horizontal flips, rotations, and color transformations. Most of the recent data augmentation methods focus on improving data augmentation techniques during the training phase. There is very little research on test-time augmentation, which contains data augmentation during the testing phase. Often, only very simple transformations are used during testing, and the predictions are frequently aggregated through simple averaging or majority voting. I propose new aggregation methods to improve the predictive performance of image classification models during the testing phase. I show on four different datasets, namely CIFAR-10, MNIST, ImageNet, and a dataset containing images for melanoma classification, that other aggregation methods, besides the commonly applied averaging and majority voting, obtain better results.
Zusammenfassung	Um die Leistung von Bildklassifikationsmodellen zu verbessern, werden die Bilder beim Trainieren eines Modells oft durch verschiedene Transformationen vermehrt. So kann man die Anzahl und die Varianz der Bilder vergrössern, ohne zusätzliche Daten sammeln zu müssen. Solche Transformationen können zum Beispiel Rotationen, horizontale Verschiebungen und Farbveränderungen beinhalten. Oft führt dies zu besseren Ergebnissen und ist eine weit verbreitete Technik. Während die Augmentation der Bilder während der Trainingsphase bereits ausgiebig erforscht wurde, existieren nur wenige Arbeiten, die sich auf die Testphase beziehen. Oft werden nur sehr einfache Transformationen während dieser Phase angewendet und die gewonnenen Prognosen auf den Testbildern werden meistens durch Mittelwertbildung oder Mehrheitsentscheidung aggregiert. In dieser Arbeit zeige ich auf vier verschiedenen Datensätzen, CIFAR-10, MNIST, ImageNet und ein Datensatz mit Bildern zur Melanomklassifizierung, dass die Augmentation von Bildern während der Testphase verbesserte Resultate erbringen. Zusätzlich zeige ich, dass neue Methoden zur Aggregierung bessere Prognosen erzielen als die herkömmlichen Methoden.
PDF File	Download
Export	BibTeX