Master Thesis MSTR-2022-87

BibliographyRapp, Jannis: Einbindung von Domänenexperten in die interaktive Verfeinerung von Clustering-Resultaten.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Master Thesis No. 87 (2022).
105 pages, german.
Abstract

Die heute verfügbare Datenmenge bietet für Unternehmen neue Möglichkeiten durch die Datenanalyse, etwa zur Verbesserung von Geschäftsprozessen oder zur Erschließung neuer Kunden. Eine populäre Form der Datenanalyse ist die Clusteranalyse, die sich mit der Gruppierung von Daten beschäftigt. In vielen Fällen ist jedoch die Clusteranalyse von externem Domänenwissen abhängig, weshalb die automatisierte Anwendung von Clustering-Verfahren keine zufriedenstellende Resultate erzeugt. Aus diesem Grund bietet es sich an, Domänenexperten mit ihrem implizit vorhandenen Domänenwissen direkt interaktiv in den Analyseprozess zu integrieren. Vorhandene interaktive Ansätze eignen sich allerdings aufgrund des Anforderungsprofils von Domänenexperten nicht und beschränken die mögliche Nutzung von Domänenwissen während der Clusteranalyse. Für eine zielführende Einbindung muss der Domänenexperte die Möglichkeit haben, während der Clusteranalyse sowohl Parameter zu spezifizieren, als auch das Resultat schrittweise zu verfeinern und auf den Anwendungsfall anzupassen. In dieser Arbeit wird ein Konzept für diese Einbindung von Domänenexperten zur interaktiven Verfeinerung von Clustering-Resultaten vorgestellt. Hierzu wird ein Prozessmodell zur umfassenden Integration eines Domänenexperten in die Clusteranalyse entwickelt und prototypisch implementiert. Eine umfangreiche Evaluation auf Basis von vier synthetisch generierten Datensätzen zeigt, dass die Kombination verschiedener Ansätze zu genaueren Ergebnissen in weniger Rechenschritten führt.

Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Schwarz, Prof. Holger; Behringer, Michael; Tschechlov, Dennis
Entry dateMarch 17, 2023
   Publ. Computer Science