Bachelor Thesis BCLR-2020-125

BibliographyBittner, Michael: Aktives Lernen zur Emotionsklassifikation auf der Basis von mehreren emotionsbasierten Modellen.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Bachelor Thesis No. 125 (2020).
131 pages, german.
Abstract

Kurzfassung

Für den Bereich des maschinellen Lernens besteht derzeit das Problem, dass die Klassifizierung von gesammelten Rohdaten durch einen Menschen nicht skalierbar ist, weswegen maschinelle Lernalgorithmen diesen Prozess automatisieren sollen. Der aktive Lernalgorithmus stellt dabei eine Möglichkeit für die Umsetzung eines solchen Algorithmus dar. Außerdem werden diese Algorithmen auf dem Gebiet der Verarbeitung natürlicher Sprache des Öfteren für die Emotionserkennung basierend auf einem einzelnen kategorialen Emotionsmodell verwendet. Es wurden jedoch inzwischen Hinweise gefunden, die darauf hindeuten, dass sich die Emotionserkennung verbessern lassen könnte, indem diskrete und dimensionale emotionsbasierte Modelle kombiniert werden.

Im Rahmen dieser Arbeit wird zum einen untersucht, ob aktiv lernende Emotionsklassifikatoren eine bessere Klassifikationsgenauigkeit erreichen können als herkömmliche Emotionsklassifikatoren, deren Trainingsdatensätze durch zufällig gewählte vorklassifizierte Instanzen erweitert worden sind, und zum anderen, ob sich der aktive Lernprozess und die darauf basierenden Klassifikatoren durch die gemeinsame Verwendung von mehreren emotionsbasierten Modellen weiter verbessern lässt. Durch die Untersuchung dieser Forschungsfragen soll der aktuelle Stand der Forschung hinsichtlich aktiv lernender Emotionsklassifikatoren ergänzt und erstmalig die Kombination von mehreren emotionsbasierten Modellen erforscht werden, um dadurch möglicherweise Hinweise für die weitere Verbesserung von aktiv lernenden Emotionsklassifikatoren zu finden.

Für die Behandlung der Forschungsfragen wurde eine Softwareanwendung entwickelt, die es ermöglicht, sowohl zufallsbasierte als auch aktiv lernende naive Bayes-Emotionsklassifikatoren zu generieren und zu testen. Dabei kann die Auswahl der Trainingsinstanzen beim aktiven Lernen von einem Gewichtungssystem abhängig gemacht werden, das die Kombination des Ekman-Modells, des PAD-Modells und der kognitiven Bewertungstheorie ermöglicht. Das Ergebnis der Trainingsphase ist dabei stets ein Emotionsklassifikator, der für die Klassifizierung von englischsprachigen Texten verwendet werden kann. Für die Erstellung und die Evaluierung dieser Klassifikatoren werden Datensätze verwendet, deren enthaltene Textinstanzen vorklassifiziert worden sind. Die Labels, auf denen sowohl die Klassifizierungen eines erstellten Klassifikators als auch die Vorklassifizierungen der verwendeten Datensätze basieren, entsprechen den Grundemotionen des Ekman-Modells ergänzt durch ein Label für die Kennzeichnung emotionsloser Texte. Die verwendeten Datensätze wurden jeweils zufällig in einen Trainingsdatensatz, einen erweiterten Trainingsdatensatz und einen Testdatensatz unterteilt. Für die Erstellung eines Klassifikators führt die Anwendung eine spezielle Trainingsphase durch, die sowohl den Trainingsdatensatz als auch den erweiterten Trainingsdatensatz verwendet. Der Testdatensatz wird dagegen für die Evaluierung eines Klassifikators durch eine Testphase verwendet, durch die die Leistungsfähigkeit eines Klassifikators in der Form eines Makro-$F_1$-Wertes berechnet wird. Bezüglich der ersten Forschungsfrage wird der Durchschnitt von 100 zufallsbasierten Klassifikatoren mit den Ergebnissen des rein Ekman-Modell basierten aktiv lernenden Klassifikators verglichen. Für die Untersuchung der zweiten Forschungsfrage werden dagegen die Ergebnisse des rein auf dem Ekman-Modell basierten aktiv lernenden Klassifikators mit den Ergebnissen der Klassifikatoren verglichen, die die unterstützten Modelle durch unterschiedliche Gewichtungen kombiniert haben.

Die Untersuchungen wiesen bezüglich der ersten Forschungsfrage deutlich darauf hin, dass sich die Klassifikationsgenauigkeit der aktiv lernenden Emotionsklassifikatoren mit steigender Größe des erweiterten Trainingsdatensatzes zunehmend stärker von den durchschnittlichen Ergebnissen der zufallsbasierten Klassifikatoren abhebt. Bezüglich der zweiten Forschungsfrage konnte auf der Grundlage der gemessenen Verläufe der Leistungsfähigkeiten für die verglichenen Emotionsklassifikatoren keine zuversichtliche Antwort gefunden werden, da es hierbei gemischte Ergebnisse gegeben hat.

Department(s)University of Stuttgart, Institute for Natural Language Processing
Superviser(s)Pado, Prof. Sebastian; Klinger, PD Dr. Roman
Entry dateDecember 22, 2021
New Report   New Article   New Monograph   Computer Science