Masterarbeit MSTR-2019-36

Bibliograph.
Daten
Golda, Robert: Integration von Datenqualitätsmethoden in das Datenflusswerkzeug FlexMash.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Masterarbeit Nr. 36 (2019).
107 Seiten, deutsch.
Kurzfassung

Durch die Digitalisierung kommen immer mehr Nutzer mit Werkzeugen zur Verarbeitung immer größerer Datenmengen in Berührung. Bei der Verarbeitung hat die Qualität der Eingabe sowie die Passgenauigkeit des Werkzeugs zur Eingabe einen starken Einfluss auf den Nutzen der Ausgabe ("garbage in, garbage out"). Für die kompetente Abschätzung dieses Zusammenhangs müssen Nutzer nicht mehr nur Experten ihres Fachgebiets sein, sondern auch Kenntnisse über die verwendeten Algorithmen aufweisen. Diese Kenntnisse, von denen man nur bei wenigen Nutzern ausgehen kann, können kompensiert werden, indem man Qualitätsmethoden in die Analysewerkzeuge integriert. Damit kann auch ein Domänenexperte, z.B. ein Politologe, ohne Wissen um die Algorithmen kompetent maschinelle Datenanalysen durchführen und kann falsche Entscheidungen vermeiden. In dieser Masterarbeit erarbeiten wir ein Konzept, das zeigt, auf welche Weise Qualitätsmethoden in ein Datenverarbeitungswerkzeug integriert werden können. Als Proof of Concept erweitern wir dazu FlexMash von Hirmer zu einem Prototyp eines Datenflusswerkzeugs für Textdaten und integrieren Methoden, die die Qualitätsindikatoren von Kiefer ermitteln. Den Mehrwert dieser Indikatoren zeigen wir anhand dieses Prototyps mit beispielhaften Experimenten. Vertiefend untersuchen wir, wie diese Indikatoren ohne vorherige Messung automatisch durch Anpassung der Berechnung verbessert werden können.

Volltext und
andere Links
Volltext
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Anwendersoftware
BetreuerMitschang, Prof. Bernhard; Kiefer, Cornelia; Hirmer, Dr. Pascal
Eingabedatum8. August 2019
   Publ. Institut   Publ. Informatik