Masterarbeit MSTR-2016-51

Bibliograph.
Daten
Foril, Alexander: Synthetic data generation for big data.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Masterarbeit Nr. 51 (2016).
129 Seiten, deutsch.
Kurzfassung

Big Data ist ein wachsendes Feld in der Informationswissenschaft in Bezug auf Speicherung, Verarbeitung und Analyse von großen Datensätzen. Beispiele für Big Data können in allen Branchen gefunden werden, wie beispielsweise in der Produktion, Medizin und Energie. Konventionelle Datenverarbeitungsmethoden sind für die neuen Aufgaben nicht ausreichend, sodass neue Algorithmen, Tools und Plattformen entwickelt werden müssen. Das Testen von neuen Ansätzen in der Wissenschaft ist jedoch nicht trivial, da große Mengen an Daten nötig sind. Diese Datensätze können nicht einfach aus realen Benutzerdaten extrahiert werden, da die Daten öfters in verschiedenen Systemen verteilt und durch Datenschutzgesetzte geschützt sind. Folglich erfordert das Entwickeln praktischer Big Data Lösungen ein hohes Maß an Zusammenarbeit mit den potenziellen Kunden. Das kann vor allem für Wissenschaftler eine erhebliche Hürde darstellen, insbesondere da die Lösungen in frühen Phasen der Entwicklung und in der Grundlagenforschung möglicherweise nicht sofort zum Kundennutzen beitragen. Um Softwareentwicklern und Wissenschaftlern zu helfen, soll in dieser Arbeit ein Framework zur synthetischen Datengenerierung für Big Data entwickelt werden. Mit diesem Framework soll es möglich sein ein Datengenerierungsszenario zu modellieren und auszuführen, um große synthetische Datensätze zu generieren. Der Big Data Generator wird anhand praktischen Anwendungsfällen aus der Automobil- und Versicherungsbranche evaluiert.

Volltext und
andere Links
Volltext
Abteilung(en)Universität Stuttgart, Institut für Architektur von Anwendungssystemen
BetreuerLeymann, Prof. Frank; Kötter, Falko; Fehling, Christoph
Eingabedatum3. Juni 2019
   Publ. Informatik