Diploma Thesis DIP-1962

BibliographyBouillet, André: Strategien zur Erweiterung eines Data Warehouse.
University of Stuttgart, Faculty of Computer Science, Diploma Thesis No. 1962 (2002).
128 pages, german.
CR-SchemaD.2.7 (Software Engineering Distribution, Maintenance, and Enhancement)
H.2.7 (Database Administration)
H.2.8 (Database Applications)
H.4.2 (Information Systems Applications Types of Systems)
J.1 (Administration Data Processing)
KeywordsData Warehouse; Realisierung; Erweiterung; OLAP; Architekturen; Vorgehensmodelle; Konzeptuelles Schema; Logisches Schema; Physisches Schema
Abstract

In den letzten Jahren ist aufgrund der immer stärker werdenden Globalisierung der Unternehmen und der damit notwendig gewordenen Vernetzung und Integration von Computersystemen die täglich anfallende Menge an Daten permanent gestiegen. Dies hat zur Folge, dass die Versorgung des Unternehmensmanagement mit den für einen Geschäftsbereich relevanten Daten zunehmend erschwert wird. Aus diesem Grund wurde die Bedeutung eines Data Warehouse, für die Unternehmen immer wichtiger.

Der offensichtliche Nutzen solcher Systeme für die Unternehmen hat sehr häufig dazu geführt, dass innerhalb kürzester Zeit Lösungen gesucht wurden, die schnell und mit wenig Aufwand kostengünstig zu realisieren waren. Unberücksichtigt dabei blieben häufig Punkte wie Integrations- und Erweiterungsfähigkeit der realisierten Data-Warehouse-Systeme und -Anwendungen. Nun stellt sich in letzter Zeit, aufgrund der zunehmenden Anzahl an Zusammenschlüssen und Kooperationen von Unternehmen, immer häufiger die Frage, wie vorhandene IT-Systeme integriert werden können. Zusätzlich werden weitergehende Anforderungen an die Systeme gestellt, so dass diese entsprechend angepasst und erweitert werden müssen.

Im Rahmen dieser Arbeit wird eine sinnvolle und effiziente Vorgehensweise für die Erweiterung bestehender Data Warehouses entwickelt.

In einem zweiten Schritt werden dann im Anschluss, die vorgestellten Konzepte anhand eines realen Systems der DaimlerChrysler AG auf ihre Machbarkeit hin überprüft. Im Zusammenhang mit der Neugestaltung ihrer Vertriebssysteme im Geschäftsfeld PKW nutzt die DaimlerChrysler AG ein Data Warehouse als Basis für flexible Auswerte- und Reportingsysteme. Daten aus einer integrierten Auftragsdatenbank werden im Data Warehouse zu Analysezwecken bereitgestellt. Als Datenmodell wurde hier ein Star-Schema gewählt. Auswertungen werden mit Reporting- und OLAP-Werkzeugen vorgenommen. Das Data Warehouse umfasst zur Zeit einzelne, anwendungsspezifische Data Marts. Das Ziel der DaimlerChrysler AG ist es jedoch, dass zukünftig der gesamte Vertriebsdatenbestand mit Hilfe der Data Marts erschlossen wird.

Hieraus ergibt sich die nachfolgende Gliederung:

In Kapitel 2 werden zunächst die Grundlagen des Data Warehousing betrachtet.

Kapitel 3 führt in die Realisierung eines Data Warehouse ein. Hierzu wird zunächst in Abschnitt 3.1 auf die unterschiedlichen Zielarchitekturen, wie Two-Tier- und Three-Tier Architekturen eingegangen. Danach werden mehrere Vorgehensmodelle vorgestellt, die eine inkrementelle Realisierung der Three-Tier-Architektur ermöglichen. In Abschnitt 3.3 wird dann der gesamte Entwicklungsprozess beschrieben, wie er für eine Data-Warehouse-Entwicklung durchlaufen werden muss.

Kapitel 4 untersucht die Möglichkeiten der Weiterentwicklung eines Data Warehouse. Dabei wird der in Abschnitt 3.3 vorgestellte Implementierungs-Prozess für Data Warehouse-Systeme auf die veränderten und zusätzlichen Erfordernisse angepasst. Dies beinhaltet neben der eventuellen Notwendigkeit eines Reverse Engineering vorhandener Systeme auch die Definition der Auswirkung von Modifikationen gegebener konzeptueller Schemata. Zusätzlich wird noch die Vorgehensweise bei der Integration zweier Data-Warehouse-Modelle betrachtet, da dies gerade im Rahmen von Zusammenschlüssen gegebener IT-Bereiche notwendig ist, sowie bei der Integration von Data Marts, die auf bestimmte Teilprozesse ausgerichtet sind.

Kapitel 5 bietet zunächst einen Überblick über die Prozesse und die Architektur des Distributionssystems der DaimlerChrysler AG im Bereich Vertrieb von PKW. Im Anschluss daran werden die Ziele und Aufgaben des darauf aufbauenden Decision-Support-Systems DISY-MIS, das im Rahmen dieser Arbeit erweitert werden soll, betrachtet.

In Kapitel 6 wird im Anschluss die prototypische Erweiterung eines Data-Warehouse-Systems in Zusammenarbeit mit der DaimlerChrysler AG aufgezeigt. Entsprechend den in Kapitel 4 vorgestellten Phasen, werden die einzelnen Schritte mit den jeweils entstandenen Modellen vorgestellt. Im Zuge der Realisierung haben sich unterschiedliche Varianten ergeben, die sich hinsichtlich der Verteilung des Systems und der erzeugten Datenmengen unterscheiden. Daneben wird auf die Probleme eingegangen, die sich im Rahmen der Realisierung ergeben haben. Zusätzlich wurden Leistungsmessungen vorgenommen, die einerseits die Auswirkungen der unterschiedlichen Implementierungsarten gemessen, andererseits die Leistungsunterschiede bei einer Vergrößerung des Datenbestands des Data-Warehouse-Systems festgehalten haben.

Die Zusammenfassung und der Ausblick in Kapitel 7 bildet den Abschluss dieser Arbeit.

Full text and
other links
PDF (6777219 Bytes)
PostScript (51449533 Bytes)
Access to students' publications restricted to the faculty due to current privacy regulations
ContactAndre.Bouillet@gmx.de
Department(s)University of Stuttgart, Institute of Parallel and Distributed High-Performance Systems, Applications of Parallel and Distributed Systems
Entry dateMarch 12, 2002
   Publ. Computer Science