Article in Journal ART-2020-04

BibliographyGiebler, Corinna; Gröger, Christoph; Hoos, Eva; Eichler, Rebecca; Schwarz, Holger; Mitschang, Bernhard: Data Lakes auf den Grund gegangen: Herausforderungen und Forschungslücken in der Industriepraxis.
In: Datenbank-Spektrum. Bd. 20(1).
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology.
pp. 57-69, german.
Springer, January 29, 2020.
DOI: 10.1007/s13222-020-00332-0.
Article in Journal.
CR-SchemaA.1 (General Literature, Introductory and Survey)
E.0 (Data General)
KeywordsData Lake; Analytics; Stand der Technik; Herausforderungen; Praxisbeispiel
Abstract

Unternehmen stehen zunehmend vor der Herausforderung, große, heterogene Daten zu verwalten und den darin enthaltenen Wert zu extrahieren. In den letzten Jahren kam darum der Data Lake als neuartiges Konzept auf, um diese komplexen Daten zu verwalten und zu nutzen. Wollen Unternehmen allerdings einen solchen Data Lake praktisch umsetzen, so stoßen sie auf vielfältige Herausforderungen, wie beispielsweise Widersprüche in der Definition oder unscharfe und fehlende Konzepte. In diesem Beitrag werden konkrete Projekte eines global agierenden Industrieunternehmens genutzt, um bestehende Herausforderungen zu identifizieren und Anforderungen an Data Lakes herzuleiten. Diese Anforderungen werden mit der verfügbaren Literatur zum Thema Data Lake sowie mit existierenden Ansätzen aus der Forschung abgeglichen. Die Gegenüberstellung zeigt, dass fünf große Forschungslücken bestehen: 1. Unklare Datenmodellierungsmethoden, 2. Fehlende Data-Lake-Referenzarchitektur, 3. Unvollständiges Metadatenmanagementkonzept, 4. Unvollständiges Data-Lake-Governance-Konzept, 5. Fehlende ganzheitliche Realisierungsstrategie.

Full text and
other links
PDF
CopyrightSpringer Nature
ContactSenden Sie eine E-Mail an Corinna.Giebler@ipvs.uni-stuttgart.de
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Project(s)DLArchitecture
Entry dateFebruary 14, 2020
   Publ. Computer Science