Master Thesis MSTR-2022-33

BibliographyVoggesberger, Julius: AutoML für Ensembles: Erhöhung der Klassifikationsperformanz durch Optimierung der Modelldiversität und der Entscheidungsfusion.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Master Thesis No. 33 (2022).
117 pages, german.
Abstract

In vielen unterschiedlichen Anwendungsbereichen werden heutzutage Algorithmen des maschinellen Lernens angewendet. Die Erstellung von Modellen mit Hilfe dieser Algorithmen ist für Nicht-Experten oft schwierig. Um Modelle zu erzeugen, die genaue Vorhersagen treffen, benötigen jedoch selbst Experten viel Zeit, da die Optimierung der Modelle anhand der Auswahl von Algorithmen und Hyperparametern ein komplexes Problem ist. Dieser Prozess kann durch AutoML automatisiert werden, sodass Nicht-Experten keine Experten für die Modellerstellung benötigen sowie weniger Zeit für die Modellerstellung aufgewendet werden muss. Auf komplexen Anwendungsfällen können jedoch einzelne Modelle keine ausreichend genauen Vorhersagen treffen. Für diese Fälle kann Ensemble Learning verwendet werden, bei dem die Vorhersagen mehrerer einzelner Modelle kombiniert wird.

In dieser Arbeit wird ein Framework erarbeitet und vorgestellt, das AutoML verwendet, um automatisch Ensembles zu erstellen. Hierzu werden zwei Aspekte von Ensembles im Detail betrachtet: Die Diversität der Modelle und die Fusion der Modellvorhersagen. Durch die automatische Optimierung von Ensembles anhand dieser beiden Aspekte soll die Vorhersagegenauigkeit der erzeugten Ensembles erhöht werden. Das hierfür erstellte Konzept wird als ein modulares Softwareframework umgesetzt. Um die Verbesserung in der Vorhersagegenauikeit aufzuzeigen, wurde das Framework auf verschiedenen Echtweltdatensätzen evaluiert. Hierbei konnte über alle Datensätze eine Verbesserung in der Performanz der Ensembles durch die Optimierung der Diversität und der Fusion festgestellt werden. Weitere Forschung hinsichtlich der Verwendung der Diversität im Rahmen dieses Frameworks ist nötig, um weitere Verbesserungen in der Vorhersagegenauigkeit der Ensembles zu erzielen.

Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Mitschang, Prof. Bernhard; Wilhelm, Yannick; Reimann, Dr. Peter
Entry dateSeptember 16, 2022
   Publ. Computer Science