Bibliography | Bernd, Florian; Wagner, Dominic: Webservice und Workflow-Technologie für Proteinmodellierung. University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Student Thesis No. 2258 (2010). 56 pages, german.
|
Abstract | Zusammenfassung:
Im letzten Jahrzehnt haben auf dem Internet basierende Dienste (Webservices), durch dessen Verbreitung, massiv an Bedeutung gewonnen. Einheitliche Standards wie Simple Object Access Protocol (SOAP) und WebService Definition Language (WSDL) tragen zur Vereinheitlichung und einer einfacheren Integration bei. Die Idee ist, die Funktionalität einer Software nicht mehr durch Einbindung von Maschinencode in Form von Software Modulen herzustellen, sondern diese Funktionalität von einem Service Anbieter (Provider) über das Internet oder Intranet anzufordern. Hieraus ergibt sich ein neuer Ansatz der Programmierung, die der Workflowsysteme. Ein Workflowsystem stellt eine Softwareplattform dar, die durch eine deskriptive Sprache (z.B. BPEL, Scufl) eine Ausführungsreihenfolge von Services bestimmt. Dem Sinn des Wortes Workflow nach, beschreiben wir somit (wiederkehrende) Arbeitsabläufe. Speziell in der Bioinformatik wird viel mit Skriptsprachen (wie Perl, Python) gearbeitet, mit denen im Prinzip solche Arbeitsabläufe ausprogrammiert werden. Ausserdem ist es nicht selten, dass Bioinformatiker von Hand mehrere hunderte Datensätze manuell in Webformulare eingeben, die Resultate durch ein weiteres Webformular senden, bis sie das endgültige Resultat in einer Tabelle abspeichern. Genau solche Webservices, die durch Webformulare angeboten werden, können auch als Aktivität in einem Workflow angeboten werden. Durch die automatisierte Bearbeitung wird Zeit, somit auch Geld gespart und der Forscher kann seine wertvolle Zeit für die Auswertung und Interpretation der Resultate verwenden. In dieser Arbeit werden, aufgrund von Anwendungsfällen zur Proteinmodellierung mit den DWARF Proteindatenbanken, Webservices (WS) für das lesen, transformieren und manipulieren von Proteindaten erstellt. Für die Verarbeitung dieser Daten werden Workflows (WF), einmal Datenfluss orientiert, mit dem Bioinformatik Workflowsystem Taverna, und Kontrollfluss orientiert, mit dem SimTech Workflowsystem basierend auf dem BPEL-Designer, erstellt. Für die Kommunikation zwischen den Services wird ein XML Format mit XML-Schema definiert.
|