Master Thesis MSTR-2018-27

BibliographyEbinger, Felix: Personenbezogene Daten im Data Lake.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Master Thesis No. 27 (2018).
105 pages, german.
Abstract

Big-Data-Analysen bieten Wettbewerbsvorteile, ermöglichen Innovationen und können zu einer höheren Qualität von Produkten oder Serviceleistungen beitragen. Insbesondere die Analyse von Kundendaten und des Kundenverhaltens eröffnet vielfältige Möglichkeiten, um dem Kunden auf ihn zugeschnittene Angebote zu unterbreiten und um so zu höheren Umsätzen und zu einer höheren Kundenzufriedenheit beizutragen. Für die dafür benötigten Daten werden geeignete Speichersysteme benötigt. Ein solches System stellt der Data Lake dar. Neben der gut skalierenden und günstigen Speicherung von Daten ist auch die Auswertung der Daten mittels explorativer Analysen bereits im Design angelegt. Gleichzeitig steht aber auch der Schutz, genauer der fehlende Schutz der Privatsphäre, des Einzelnen bei Big Data Verarbeitungen im Mittelpunkt der öffentlichen Aufmerksamkeit und Kritik. Insbesondere wird vor dem so entstehenden „gläsernen Menschen“ und den daraus resultierenden gesellschaftlichen Folgen gewarnt. Die sich daraus ergebenden Fragen, in welchem Umfang und auf welche Art personenbezogene Daten verarbeitet werden dürfen, bedürfen, neben einer ethisch-moralischen, vor allem einer rechtlichen Antwort. Die europäische Datenschutzgrundverordnung stellt hierzu den rechtlichen Rahmen dar, in dem personenbezogene Daten verarbeitet werden dürfen. In dieser Arbeit werden die gesetzlichen Anforderungen mit dem Konzept des Data Lakes abgeglichen und es wird aufgezeigt, wo Herausforderungen beim Design und bei der Implementierung eines Data Lakes entstehen (z.B. Transparenz, Zweckbindung, Recht auf Löschung). Zudem werden Lösungsansätze für diese Herausforderungen entwickelt und vorgestellt. Aus den einzelnen Lösungsansätzen werden zwei Lösungskonzepte für einige der identifizierten Herausforderungen entwickelt. Eines der Konzepte, ein Metadaten-Modell, wird dabei prototypisch umgesetzt und anhand von Use Cases beispielhaft getestet.

Full text and
other links
Volltext
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Schwarz, PD Dr. Holger; Giebler, Corinna
Entry dateMay 27, 2019
   Publ. Computer Science