Article in Journal ART-2020-10

BibliographyGiebler, Corinna; Gröger, Christoph; Hoos, Eva; Eichler, Rebecca; Schwarz, Holger; Mitschang, Bernhard: Data Lakes auf den Grund gegangen - Herausforderungen und Forschungslücken in der Industriepraxis.
In: Datenbank Spektrum. Bd. 20.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology.
pp. 57-69, german.
Springer-Verlag, January 29, 2020.
Article in Journal.
CR-SchemaH.2.1 (Database Management Logical Design)
KeywordsData Lakes; Industryerfahrung
Abstract

Unternehmen stehen zunehmend vor der Herausforderung, große, heterogene Daten zu verwalten und den darin enthaltenen Wert zu extrahieren. In den letzten Jahren kam darum der Data Lake als neuartiges Konzept auf, um diese komplexen Daten zu verwalten und zu nutzen. Wollen Unternehmen allerdings einen solchen Data Lake praktisch umsetzen, so stoßen sie auf vielfältige Herausforderungen, wie beispielsweise Widersprüche in der Definition oder unscharfe und fehlende Konzepte. In diesem Beitrag werden konkrete Projekte eines global agierenden Industrieunternehmens genutzt, um bestehende Herausforderungen zu identifizieren und Anforderungen an Data Lakes herzuleiten. Diese Anforderungen werden mit der verfügbaren Literatur zum Thema Data Lake sowie mit existierenden Ansätzen aus der Forschung abgeglichen. Die Gegenüberstellung zeigt, dass fünf große Forschungslücken bestehen: 1. Unklare Datenmodellierungsmethoden, 2. Fehlende Data-Lake-Referenzarchitektur, 3. Unvollständiges Metadatenmanagementkonzept, 4. Unvollständiges Data-Lake-Governance-Konzept, 5. Fehlende ganzheitliche Realisierungsstrategie.

CopyrightSpringer Verlag
ContactSenden Sie eine E-Mail an Corinna.Giebler@ipvs.uni-stuttgart.de
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Entry dateSeptember 23, 2020
   Publ. Department   Publ. Institute   Publ. Computer Science