Student Thesis STUD-1806

BibliographyKraft, Tobias: Datenmodellierung für Data Mining und OLAP.
University of Stuttgart, Faculty of Computer Science, Student Thesis No. 1806 (2001).
102 pages, german.
CR-SchemaH.2.1 (Database Management Logical Design)
H.2.7 (Database Administration)
H.2.8 (Database Applications)
KeywordsBusiness Intelligence; Data Mining; OLAP; Data Warehouse; Data Warehousing; Datenmodellierung; Datenmodelle
Abstract

Im Bereich Business Intelligence werden verschiedenste Methoden und Werkzeuge eingesetzt, um unternehmensweite Datenbestände in einem Data Warehouse zu analysieren. Wichtige Vertreter sind hier das Online Analytical Processing (OLAP) und das Data Mining. In der praktischen Anwendung sind meist sowohl Werkzeuge aus dem OLAP-Bereich als auch aus dem Data-Mining-Bereich notwendig, um im Data Warehouse eines Unternehmens alle relevanten Informationen aufzufinden.

Diese Arbeit befasst sich daher mit der Frage, wie Daten in einem Data Warehouse strukturiert sein sollten, um den Einsatz von Werkzeugen aus den Bereichen OLAP und Data Mining gleichermaßen zu unterstützen.

Hierzu werden zunächst verschiedene Modellierungsalternativen aus dem OLAP-Bereich betrachtet. Anschließend wird untersucht, welche Anforderungen die verschiedenen Data-Mining-Methoden und -Algorithmen an die Datenmodellierung stellen. Zusätzlich werden einige ausgewählte Software-Werkzeuge betrachtet, wobei die Datenimport- und Vorverarbeitungsmöglichkeiten im Vordergrund stehen, da sie letztlich die Anforderungen an die Datenmodellierung festlegen. Danach wird ein Klassifizierungsschema für Data-Mining-Fragestellungen entworfen. Die zu den einzelnen Klassen gehörenden Zahlen von Join-Operationen werden für die verschiedenen OLAP-Datenmodelle ermittelt und zur Bewertung bzw. zum Vergleich der Vorverarbeitungskomplexität der verschiedenen OLAP-Datenmodellen verwendet. In diesem Zusammenhang werden auch einige Optimierungsmöglichkeiten besprochen und das Klassifizierungsschema auf eine Menge von Beispiel-Fragestellungen angewandt. Abschließend wird eine Liste von Empfehlungen zur Datenmodellierung von Data Warehouses für die Anwendung von OLAP- und Data-Mining-Werkzeugen erstellt, die das Ergebnis dieser Arbeit darstellt.

Full text and
other links
PostScript (5724767 Bytes)
Access to students' publications restricted to the faculty due to current privacy regulations
Department(s)University of Stuttgart, Institute of Parallel and Distributed High-Performance Systems, Applications of Parallel and Distributed Systems
Project(s)ORBIT
Entry dateJune 6, 2001
   Publ. Department   Publ. Institute   Publ. Computer Science