Bachelorarbeit BCLR-2019-37

Bibliograph.
Daten
Voggesberger, Julius: Evaluation von Zwischenergebnissen in Entscheidungsbäumen.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Bachelorarbeit Nr. 37 (2019).
89 Seiten, deutsch.
Kurzfassung

Durch Technologien wie das Internet der Dinge und die Industrie 4.0 steigt die Menge an Daten auf der Welt rasant an. Klassifikationsalgorithmen werden von Analysten verwendet, um diese Menge an Daten zu analysieren. Eine Gruppe der populärsten Klassifikationsalgorithmen sind Entscheidungsbaumalgorithmen. Diese stellen erlernte Modelle menschenverständlich als einen Baum dar. Durch die steigende Menge an Daten kann es jedoch vorkommen, dass die erstellten Bäume immer größer, komplexer und unverständlicher für Analysten werden. Häufig werden die Bäume nachdem sie erstellt wurden gestutzt, um sie so kleiner und verständlicher zu machen. Methoden, die die Bäume nach der Erstellung kürzen, werden Post-Pruning-Methoden genannt. Jedoch benötigen Post-Pruning-Methoden eine hohe Laufzeit, da der Entscheidungsbaum erst komplett erstellt werden muss, ehe er gekürzt werden kann. Eine wenig erforschte Alternative sind Methoden, die während der Erstellung des Entscheidungsbaumes diesen kürzen. Diese Methoden werden auch Pre-Pruning-Methoden genannt. In dieser Arbeit wird ein Verfahren vorgestellt, mit dem Pre-Pruning-Methoden allgemeingültig auf Entscheidungsbäume der Familie der Top-Down Induction of Decision Trees angewendet werden können. Viele Pre-Pruning-Methoden benötigen Schwellenwerte. Aus diesem Grund wurde weiterhin ein Ansatz entwickelt, der es einem Analysten ermöglicht für eine gewünschte Baumqualität einen Schwellenwert für die Pre-Pruning-Methoden zu erhalten. Dieser Ansatz soll es ermöglichen, die Pre-Pruning-Methoden evaluieren zu können. Eine Evaluation mithilfe dieses Ansatzes zeigt, dass hohe Laufzeiteinsparungen mithilfe der Pre-Pruning-Methoden möglich sind. Es konnten jedoch keine zuverlässigen Aussagen hinsichtlich der Qualität der Pre-Pruning-Methoden getroffen werden. Weitere Forschung hinsichtlich der Einflüsse von Datensätzen auf diese Methoden ist nötig, um zuverlässige Aussagen über die Qualität der Methoden treffen zu können.

Volltext und
andere Links
Volltext
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Anwendersoftware
BetreuerSchwarz, PD Dr. Holger; Fritz, Manuel
Eingabedatum7. August 2019
   Publ. Abteilung   Publ. Institut   Publ. Informatik