Master Thesis MSTR-2023-51

BibliographyLekar, Dominik: Einfluss von Bildausschnittgröße und Hyperparametern auf Computer Vision Modelle.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Master Thesis No. 51 (2023).
60 pages, german.
Abstract

Lange Zeit galten faltende neuronale Netze (CNN) als Stand der Technik in vielen Aufgabengebieten der Computer Vision, wie beispielsweise der Bildklassifizierung. Dank technischem Fortschritt konnten sich jedoch in den letzten Jahren auch andere Computer Vision Modelle etablieren. Insbesondere Vision Transformer(ViT) und mehrschichtige Perzeptron(MLP) Modelle verarbeiten die Bilder in Bildausschnitten. Häufig wird in Arbeiten jedoch nur entweder eine Größe mit unterschiedlichen Hyperparametern, oder aber mehrereAusschnittsgrößen mit denselben Parametern evaluiert. Auf diese Weise lassen sich keine Rückschlüsse ziehen, welche Wechselwirkungen zwischen unterschiedlichen Ausschnittsgrößen und anderen Hyperparametern bestehen. Diese Arbeit beschäftigt sich daher mit der Untersuchung ebendieser Wechselwirkungen. Hierbei wird ein Framework implementiert, mit dem sich eine automatisierte Evaluierung durchführen lässt. In jedem Trainingsdurchlauf wird der Wert eines Hyperparameters gleichmäßig variiert und mit mehreren Ausschnittsgrößen evaluiert. Untersucht werden neben der Genauigkeit des Modells auch Laufzeit und Speicherbedarf des Trainingsprozesses. Die Ergebnisse werden anhand eines Beispieldatensatzes vorgestellt und anschließend für jeden der evaluierten Hyperparameter zu einem Wert zusammengefasst, der sich anschließend mit den Werten der restlichen Ausschnittsgrößen vergleichen lässt. Dabei kann gezeigt werden, dass sich Hyperparameter in manchen Situationen durchaus unterschiedlich auf andere Ausschnittsgrößen auswirken, es jedoch häufig schwierig ist allgemeine Schlüsse zu ziehen.

Full text and
other links
Volltext
Department(s)University of Stuttgart, Institute of Visualisation and Interactive Systems, Visualisation and Interactive Systems
Superviser(s)Weiskopf, Prof. Daniel; Vidyapu, Dr. Sandeep; Bauer, Ruben
Entry dateNovember 15, 2023
   Publ. Computer Science