Master Thesis MSTR-2019-36

BibliographyGolda, Robert: Integration von Datenqualitätsmethoden in das Datenflusswerkzeug FlexMash.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Master Thesis No. 36 (2019).
107 pages, german.
Abstract

Durch die Digitalisierung kommen immer mehr Nutzer mit Werkzeugen zur Verarbeitung immer größerer Datenmengen in Berührung. Bei der Verarbeitung hat die Qualität der Eingabe sowie die Passgenauigkeit des Werkzeugs zur Eingabe einen starken Einfluss auf den Nutzen der Ausgabe ("garbage in, garbage out"). Für die kompetente Abschätzung dieses Zusammenhangs müssen Nutzer nicht mehr nur Experten ihres Fachgebiets sein, sondern auch Kenntnisse über die verwendeten Algorithmen aufweisen. Diese Kenntnisse, von denen man nur bei wenigen Nutzern ausgehen kann, können kompensiert werden, indem man Qualitätsmethoden in die Analysewerkzeuge integriert. Damit kann auch ein Domänenexperte, z.B. ein Politologe, ohne Wissen um die Algorithmen kompetent maschinelle Datenanalysen durchführen und kann falsche Entscheidungen vermeiden. In dieser Masterarbeit erarbeiten wir ein Konzept, das zeigt, auf welche Weise Qualitätsmethoden in ein Datenverarbeitungswerkzeug integriert werden können. Als Proof of Concept erweitern wir dazu FlexMash von Hirmer zu einem Prototyp eines Datenflusswerkzeugs für Textdaten und integrieren Methoden, die die Qualitätsindikatoren von Kiefer ermitteln. Den Mehrwert dieser Indikatoren zeigen wir anhand dieses Prototyps mit beispielhaften Experimenten. Vertiefend untersuchen wir, wie diese Indikatoren ohne vorherige Messung automatisch durch Anpassung der Berechnung verbessert werden können.

Full text and
other links
Volltext
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Mitschang, Prof. Bernhard; Kiefer, Cornelia; Hirmer, Dr. Pascal
Entry dateAugust 8, 2019
   Publ. Computer Science