Diploma Thesis DIP-3309

BibliographyPietranek, Henrik Andreas: Datenmanagementpatterns in multi-skalaren Simulationsworkflows.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Diploma Thesis No. 3309 (2012).
173 pages, german.
CR-SchemaD.2.11 (Software Engineering Software Architectures)
H.2.5 (Heterogeneous Databases)
H.4.1 (Office Automation)
I.6.7 (Simulation Support Systems)
KeywordsDatenbereitstellung; Datenmanagement; Datenmanagementpatterns; Simulationsworkflows; wissenschaftliche Workflows
Abstract

In den vergangenen Jahren haben sich im unternehmerischen Umfeld Workflows zur Beschreibung und Ausführung von (Geschäfts-)Prozessen durchgesetzt. Seit kurzem wird diese Technologie auch in der Wissenschaft eingesetzt. Z.B. werden Simulationsabläufe als Workflows modelliert. Charakteristisch für solche Simulationen bzw. Simulationsabläufe sind komplexe mathematische Berechnungen sowie verschiedene Aufgaben im Bereich der Datenverwaltung und Datenbereitstellung. Oftmals müssen große Datenmengen, die in proprietären Formaten vorliegen, aus verschiedenen Quellen verarbeitet werden. Damit diese Daten durch einen Simulationsworkflow und den von ihm eingebundenen Programmen und Diensten verarbeitet werden können, müssen sie in passende Eingabeformate transformiert werden. Gerade bei umfangreichen Simulationen, die eine Vielzahl an Datenquellen benötigen, führt dies aufgrund der enormen Komplexität zu Problemen.

Um diese Probleme zu lösen, wurde das SIMPL-Rahmenwerk (SimTech - Information Management, Processes and Languages) entwickelt. Das SIMPL-Rahmenwerk ist in ein Scientifc Workflow Management System eingebettet und schafft eine Abstraktionsebene für die Defnition des Datenmanagements. SIMPL bietet einheitliche Zugriffsmethoden, um, aus einem Simulationsworkflow heraus, auf beliebige Datenquellen zuzugreifen.

Ein weiterer Bestandteil des SIMPL-Rahmenwerks sind Datenmanagementpatterns. Dabei handelt es sich um vorgefertigte Datenmanagement-Operationen, die nur noch parametrisiert werden müssen. Auf diese Weise wird eine neue Abstraktionsebene geschaffen. In einer vorherigen Arbeit wurden bereits erste Datenmanagementpatterns erarbeitet. So können z.B. Daten zwischen zwei Datenressourcen ausgetauscht werden. Des Weiteren wurde ein Konzept erarbeitet, um Datenmanagementpatterns auf ausführbare Workflow-Fragmente abzubilden. Dieses Konzept nutzt Transformationsregeln sowie gespeicherte Metadaten über beteiligte Ressourcen als Basis. Im Rahmen dieser Diplomarbeit wird das bereits entwickelte Konzept erweitert und wenn nötig angepasst, um auf multi-skalare Simulationen angewendet werden zu können. Darüber hinaus wird die prototypische Umsetzung des SIMPL-Rahmenwerks um Datenmanagementpatterns erweitert.

Full text and
other links
PDF (5666360 Bytes)
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Reimann, Peter
Project(s)SimTech - DP4SW
Entry dateOctober 17, 2012
   Publ. Computer Science