Bachelorarbeit BCLR-2020-44

Bibliograph.
Daten
Rapp, Jannis: Datenqualitätsmetriken zur Unterstützung von Domänenexperten bei interaktiven Analysen.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Bachelorarbeit Nr. 44 (2020).
96 Seiten, deutsch.
Kurzfassung

Die in den letzten Jahren massiv angestiegenen Datenmengen führen zu zunehmenden Herausforderungen im Bereich der Datenanalyse. Automatische Methoden können bisher das für belastbare Analysen notwendige Domänenwissen nicht berücksichtigen, während gleichzeitig Domänenexperten immer häufiger eigenständige Analysen durchführen möchten. Der populäre Ansatz Self-Service-Business-Intelligence bietet hierfür jedoch zu wenig Freiheiten, weshalb häufig Data Mashup-Ansätze verwendet werden. Bei diesen stellen fehlerhafte Daten ein Problem dar, durch welches das Ergebnis von interaktiven Analysen wesentlich beeinflusst werden kann. Es ergibt sich die Herausforderung den Domänenexperten während der interaktiven Analyse zu unterstützen und so den Einfluss fehlerhafter Daten auf das Ergebnis der Analyse zu minimieren. In dieser Arbeit wird ein Konzept zur Unterstützung von Domänenexperten anhand einer in den Analyseprozess integrierten Datenqualitätsüberwachung entwickelt. Dieses Konzept definiert ein Prozessmodell für eine an den Bedürfnissen des Domänenexperten orientierte Überwachung der Datenqualität sowie Richtlinien für die Implementierung der enthaltenen Komponenten. Dieses wurde prototypisch in das an der Universität Stuttgart entwickelte Data Mashup-Werkzeug „FlexMash“ zur Modellierung von Datenflüssen implementiert und belegt die grundlegende Funktionalität des vorgestellten Ansatzes.

Volltext und
andere Links
Volltext
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Anwendersoftware
BetreuerSchwarz, PD Dr. Holger; Behringer, Michael
Eingabedatum23. November 2020
   Publ. Informatik