Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Visualization of Deep Features with Grad-CAM and LOTS
Organization Unit
Authors
  • Maximilian Weber
Supervisors
  • Manuel Günther
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2023
Abstract Text Deep learning models, particularly Convolutional Neural Networks (CNNs), have achieved remarkable success in image classification tasks. However, their lack of interpretability raises concerns about their trustworthiness, especially in high-risk domains like healthcare. To improve transparency, Explainable Artificial Intelligence (XAI) techniques have been developed. This thesis has a primary focus on expanding the Layerwise Origin Target Synthesis (LOTS) method, which is originally designed as a technique for generating adversarial images, to incorporate visualization capabilities. The aim is to address the limitations observed in current CAM-based visualization techniques that only offer broad area visualizations. The research explores methods for evaluating and comparing visualization techniques in the absence of a standard evaluation metric framework. Additionally, it investigates the applicability of the extended LOTS visualization technique to classes not present in the training dataset. Based on our findings, the LOTS visualization algorithm we propose, generates more focused visualizations that do not require explicit class specification, thereby also serving as a valuable tool for evaluating image quality within a training set. Furthermore, by adjusting the size of the Gaussian blur filter, it is possible to highlight fine locations in an image. Moreover, we demonstrate the potential for extending the LOTS algorithm to classes not included in the training dataset, although further research is required for validation. Lastly, we emphasize the importance of a standardized evaluation metrics framework.
Zusammenfassung Deep-Learning-Modelle, insbesondere "Convolutional Neural Networks" (CNNs), haben beachtlichen Erfolg bei der Klassifizierung von Bildern erzielt. Jedoch werfen ihre mangelnde Interpretierbarkeit Bedenken hinsichtlich ihrer Verlässlichkeit und Vertrauenswürdigkeit auf, insbesondere in hochriskanten Bereichen wie dem Gesundheitswesen. Um die Transparenz zu verbessern, wurden Techniken der erklärungsfähigen künstlichen Intelligenz (XAI) entwickelt. Diese Arbeit hat einen Schwerpunkt auf der Erweiterung der "Layerwise Origin Target Synthesis" (LOTS) Methode, die ursprünglich als Technik zur Generierung von "adversarial" Bildern entwickelt wurde, um Visualisierungsfähigkeiten. Ziel ist es, die beobachteten Einschränkungen der gängigen CAM-basierten Visualisierungstechniken, die nur allgemeine Flächenvisualisierungen bieten, zu überwinden. Die Forschung untersucht Methoden zur Evaluierung und Vergleich von Visualisierungstechniken in Abwesenheit eines standardisierten Evaluierungsmetriken-Frameworks. Zusätzlich wird die Anwendbarkeit der erweiterten LOTS-Visualisierungstechnik auf Klassen, die nicht im Trainingsdatensatz vorhanden sind, untersucht. Basierend auf unseren Erkenntnissen generiert der von uns vorgeschlagene LOTS-Visualisierungsalgorithmus fokussiertere Visualisierungen, die keine explizite Klassenspezifikation erfordern und daher auch als wertvolles Werkzeug zur Bewertung der Bildqualität innerhalb eines Trainingsdatensatzes dienen. Darüber hinaus ist es möglich, durch Anpassung der Grösse des Gauss'schen Weichzeichnungsfilters den Grad der Pixel-Fokussierung in den Visualisierungen zu erhöhen. Zudem zeigen wir das Potenzial zur Erweiterung des LOTS-Algorithmus auf Klassen, die nicht im Trainingsdatensatz enthalten sind, wobei jedoch weitere Forschung zur Validierung erforderlich ist. Ausserdem betonen wir die Bedeutung eines standardisierten Evaluierungsmetriken-Frameworks.
PDF File Download
Export BibTeX