Bachelorarbeit BCLR-2019-35

Bibliograph.
Daten
Roggenbuck, Kay: Feature-getriebene Darstellung von Clustering-Resultaten.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Bachelorarbeit Nr. 35 (2019).
73 Seiten, deutsch.
Kurzfassung

Durch die voranschreitende Digitalisierung steigt die Menge an erzeugten und gespeicherten Daten schnell an. Um diese Datenmenge dem Menschen verständlich zu machen, werden häufig Data-Mining-Verfahren wie beispielsweise Clustering eingesetzt. Clustering-Verfahren separieren den zugrunde liegenden Datensatz in Gruppen mit Ähnlichkeiten. Da Clustering-Verfahren keine Dimensionsreduktion durchführen, besitzen die Resultate noch immer viele Dimensionen und Datenpunkte. Dies sorgt dafür, dass die Interpretation dieser Resultate für den Menschen schwer ist. In dieser Arbeit wird ein Ansatz vorgestellt, welcher eine ausreichend detaillierte und zudem einfach verständliche Darstellung für Clustering-Resultate liefert. Um eine solche Darstellung zu ermöglichen, werden einzelne Cluster durch eine geringe Anzahl ausgewählter Informationen repräsentiert. Dabei werden Features anhand ausgewählter und neu entwickelter Metriken nach ihrer Aussagekraft für das Clustering bewertet und ausgewählt. Für die Wertebereiche dieser Features werden statistische Kenngrößen ermittelt. Weiterhin werden verschiedene Darstellungsformen dieser Ergebnisse vorgestellt, wie zum Beispiel Tabellen oder Wortwolken. Eine Evaluation mithilfe eines Goldstandards zeigt, dass der entwickelte Ansatz für das Finden aussagekräftiger Features eine hohe Genauigkeit und eine lineare Laufzeitkomplexität besitzt.

Volltext und
andere Links
Volltext
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Anwendersoftware
BetreuerSchwarz, PD Dr. Holger; Fritz, Manuel; Behringer, Michael
Eingabedatum7. August 2019
   Publ. Abteilung   Publ. Institut   Publ. Informatik