Studienarbeit STUD-1806

Bibliograph.
Daten
Kraft, Tobias: Datenmodellierung für Data Mining und OLAP.
Universität Stuttgart, Fakultät Informatik, Studienarbeit Nr. 1806 (2001).
102 Seiten, deutsch.
CR-Klassif.H.2.1 (Database Management Logical Design)
H.2.7 (Database Administration)
H.2.8 (Database Applications)
KeywordsBusiness Intelligence; Data Mining; OLAP; Data Warehouse; Data Warehousing; Datenmodellierung; Datenmodelle
Kurzfassung

Im Bereich Business Intelligence werden verschiedenste Methoden und Werkzeuge eingesetzt, um unternehmensweite Datenbestände in einem Data Warehouse zu analysieren. Wichtige Vertreter sind hier das Online Analytical Processing (OLAP) und das Data Mining. In der praktischen Anwendung sind meist sowohl Werkzeuge aus dem OLAP-Bereich als auch aus dem Data-Mining-Bereich notwendig, um im Data Warehouse eines Unternehmens alle relevanten Informationen aufzufinden.

Diese Arbeit befasst sich daher mit der Frage, wie Daten in einem Data Warehouse strukturiert sein sollten, um den Einsatz von Werkzeugen aus den Bereichen OLAP und Data Mining gleichermaßen zu unterstützen.

Hierzu werden zunächst verschiedene Modellierungsalternativen aus dem OLAP-Bereich betrachtet. Anschließend wird untersucht, welche Anforderungen die verschiedenen Data-Mining-Methoden und -Algorithmen an die Datenmodellierung stellen. Zusätzlich werden einige ausgewählte Software-Werkzeuge betrachtet, wobei die Datenimport- und Vorverarbeitungsmöglichkeiten im Vordergrund stehen, da sie letztlich die Anforderungen an die Datenmodellierung festlegen. Danach wird ein Klassifizierungsschema für Data-Mining-Fragestellungen entworfen. Die zu den einzelnen Klassen gehörenden Zahlen von Join-Operationen werden für die verschiedenen OLAP-Datenmodelle ermittelt und zur Bewertung bzw. zum Vergleich der Vorverarbeitungskomplexität der verschiedenen OLAP-Datenmodellen verwendet. In diesem Zusammenhang werden auch einige Optimierungsmöglichkeiten besprochen und das Klassifizierungsschema auf eine Menge von Beispiel-Fragestellungen angewandt. Abschließend wird eine Liste von Empfehlungen zur Datenmodellierung von Data Warehouses für die Anwendung von OLAP- und Data-Mining-Werkzeugen erstellt, die das Ergebnis dieser Arbeit darstellt.

Volltext und
andere Links
PostScript (5724767 Bytes)
Zugriff auf studentische Arbeiten aufgrund vorherrschender Datenschutzbestimmungen nur innerhalb der Fakultät möglich
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Höchstleistungsrechner, Anwendersoftware
Projekt(e)ORBIT
Eingabedatum6. Juni 2001
   Publ. Informatik