Bachelor Thesis BCLR-2020-44

BibliographyRapp, Jannis: Datenqualitätsmetriken zur Unterstützung von Domänenexperten bei interaktiven Analysen.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Bachelor Thesis No. 44 (2020).
96 pages, german.
Abstract

Die in den letzten Jahren massiv angestiegenen Datenmengen führen zu zunehmenden Herausforderungen im Bereich der Datenanalyse. Automatische Methoden können bisher das für belastbare Analysen notwendige Domänenwissen nicht berücksichtigen, während gleichzeitig Domänenexperten immer häufiger eigenständige Analysen durchführen möchten. Der populäre Ansatz Self-Service-Business-Intelligence bietet hierfür jedoch zu wenig Freiheiten, weshalb häufig Data Mashup-Ansätze verwendet werden. Bei diesen stellen fehlerhafte Daten ein Problem dar, durch welches das Ergebnis von interaktiven Analysen wesentlich beeinflusst werden kann. Es ergibt sich die Herausforderung den Domänenexperten während der interaktiven Analyse zu unterstützen und so den Einfluss fehlerhafter Daten auf das Ergebnis der Analyse zu minimieren. In dieser Arbeit wird ein Konzept zur Unterstützung von Domänenexperten anhand einer in den Analyseprozess integrierten Datenqualitätsüberwachung entwickelt. Dieses Konzept definiert ein Prozessmodell für eine an den Bedürfnissen des Domänenexperten orientierte Überwachung der Datenqualität sowie Richtlinien für die Implementierung der enthaltenen Komponenten. Dieses wurde prototypisch in das an der Universität Stuttgart entwickelte Data Mashup-Werkzeug „FlexMash“ zur Modellierung von Datenflüssen implementiert und belegt die grundlegende Funktionalität des vorgestellten Ansatzes.

Full text and
other links
Volltext
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Schwarz, PD Dr. Holger; Behringer, Michael
Entry dateNovember 23, 2020
   Publ. Computer Science