Master Thesis MSTR-2018-45

BibliographyKeppler, Nicole: Zugriffskontrollmodel für Data Lakes.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Master Thesis No. 45 (2018).
89 pages, german.
Abstract

Zugriffskontrollmodelle werden in Systemen zur Absicherung gegen unberechtigte Systemzugriffe angewandt. Die Verschiedenen Zugriffskontrollmodelle unterscheiden sich vor allem in ihrer Ausdruckskraft, die benötigten Zugriffsregelungen für das System abzubilden. Mit der wachsenden Komplexität und Größe der Systeme wachsen auch die Anforderungen an ein Zugriffskontrollmodell. Während sich für seit Jahren bestehende Speicherkonzepte passende Zugriffskontrollkonzepte etabliert haben, fehlt es neueren Konzepten an einem passenden Zugriffskontrollmodell. Dies ist bei Data Lakes der Fall. Data Lake ist ein Konzept, dass die Datenvielfalt und Flexibilität im Datenspeicher in den Fokus stellt. Während in anderen Konzepten, wie zum Beispiel dem Data Warehouse, eine Vorverarbeitung der Daten stattfindet, erlaubt das Data Lake eine native Datenspeicherung. Dies bedeutet zwar eine notwendige Anreicherung der Daten in einem Vorverarbeitungsprozess, der Datensatz an sich bleibt jedoch in seinem Rohformat erhalten. Somit können sich in einem Data Lake unterschiedliche Daten mit verschiedenen Datenformaten sammeln. Diese Arbeit behandelt die Ausarbeitung eines Zugriffskontrollkonzeptes für Data Lakes. Mit der Erklärung des Data Lake Konzeptes und dessen Charakteristika wird zu Beginn ein Grundverständnis geschaffen. Unabhängig vom Data Lake erfolgt eine Aufstellung bestehender Zugriffskontrollmodelle, um einen Überblick der Möglichkeiten für ein Zugriffskontrollmodell für Data Lakes zu schaffen. Zur Auswahl eines Zugriffskontrollmodells für Data Lakes werden aus dem Grundverständnis des Konzeptes und der Vorstellung der bestehenden Zugriffskontrollmodelle Anforderungen herausgearbeitet. Anhand dieser Anforderungen erfolgt eine Evaluation der Modelle. Die Auswertung zeigt, dass durch die Kombination mehrerer bestehender Zugriffskontrollmodelle eine alle Kriterien abdeckende Lösung für Data Lakes gefunden werden kann. Daraus ergibt sich ein hybrider Ansatz basierend auf dem attributbasierten Zugriffskontrollmodell, das mit Elementen aus dem Bell-LaPadula, dem Biba und dem rollenbasierten Zugriffskontrollmodell erweitert wird. Mithilfe eines Anwendungsfalls aus dem Bereich E-Health wird eine exemplarische Modellierung und Implementierung des ausgearbeiteten Zugriffskontrollmodells für Data Lakes vorgenommen.

Full text and
other links
Volltext
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Schwarz, PD Dr. Holger; Reimann, Dr. Peter; Giebler, Corinna
Entry dateJune 3, 2019
   Publ. Department   Publ. Institute   Publ. Computer Science