Master Thesis MSTR-2016-51

BibliographyForil, Alexander: Synthetic data generation for big data.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Master Thesis No. 51 (2016).
129 pages, german.
Abstract

Big Data ist ein wachsendes Feld in der Informationswissenschaft in Bezug auf Speicherung, Verarbeitung und Analyse von großen Datensätzen. Beispiele für Big Data können in allen Branchen gefunden werden, wie beispielsweise in der Produktion, Medizin und Energie. Konventionelle Datenverarbeitungsmethoden sind für die neuen Aufgaben nicht ausreichend, sodass neue Algorithmen, Tools und Plattformen entwickelt werden müssen. Das Testen von neuen Ansätzen in der Wissenschaft ist jedoch nicht trivial, da große Mengen an Daten nötig sind. Diese Datensätze können nicht einfach aus realen Benutzerdaten extrahiert werden, da die Daten öfters in verschiedenen Systemen verteilt und durch Datenschutzgesetzte geschützt sind. Folglich erfordert das Entwickeln praktischer Big Data Lösungen ein hohes Maß an Zusammenarbeit mit den potenziellen Kunden. Das kann vor allem für Wissenschaftler eine erhebliche Hürde darstellen, insbesondere da die Lösungen in frühen Phasen der Entwicklung und in der Grundlagenforschung möglicherweise nicht sofort zum Kundennutzen beitragen. Um Softwareentwicklern und Wissenschaftlern zu helfen, soll in dieser Arbeit ein Framework zur synthetischen Datengenerierung für Big Data entwickelt werden. Mit diesem Framework soll es möglich sein ein Datengenerierungsszenario zu modellieren und auszuführen, um große synthetische Datensätze zu generieren. Der Big Data Generator wird anhand praktischen Anwendungsfällen aus der Automobil- und Versicherungsbranche evaluiert.

Full text and
other links
Volltext
Department(s)University of Stuttgart, Institute of Architecture of Application Systems
Superviser(s)Leymann, Prof. Frank; Kötter, Falko; Fehling, Christoph
Entry dateJune 3, 2019
   Publ. Computer Science