Student Thesis STUD-1805

BibliographyBouillet, André: Realisierung und Optimierung einer Data-Mining-Anwendung.
University of Stuttgart, Faculty of Computer Science, Student Thesis No. 1805 (2001).
116 pages, german.
CR-SchemaH.2.8 (Database Applications)
H.3.3 (Information Search and Retrieval)
H.3.4 (Information Storage and Retrieval Systems and Software)
H.4.2 (Information Systems Applications Types of Systems)
Abstract

In den letzten Jahren ist die täglich anfallenden Menge an Daten kontinuierlich gestiegen. Hieraus entstand das Problem, dass das Informationsangebot für das Unternehmensmanagement zunimmt, und dessen Versorgung mit den entscheidungsrelevanten Daten zunehmend erschwert wird.

Neben OLAP hat sich als eine weitere Möglichkeit Informationen aus diesen großen Datenmenge zu extrahieren, das "Data Mining" entwickelt. Diese Arbeit beschäftigt sich zunächst mit den Grundlagen des Data Mining, insbesondere mit dem Mining-Ablauf und den unterschiedlichen Mining-Algorithmen. Daneben wird die Vorgehensweise zur Implementierung einer Data-Mining-Anwendung mit Hilfe des "Intelligent Miner for Data" von IBM auf bestehenden Daten betrachtet. Hierzu wird die Datenbasis des TPC-H-Benchmarks verwendet.

Weiterer Schwerpunkt dieser Arbeit ist die Untersuchung unterschiedlicher Optimierungsmöglichkeiten auf Datenbankseite zur Beschleunigung der Analyselaufzeiten. Hierzu wird der Einfluß von Implementierungsaspekten, wie die Verwendung von Views, materialisierten Tabellen oder Summary Tables betrachtet. Zusätzlich wird auch auf die Auswirkungen der Attributanzahl der zu analysierenden Relationen eingegangen. Als ein weiterer Punkt wird die Verwendung von Indizes untersucht.

Der Abschluß dieser Arbeit vergleicht die Laufzeiten der zuvor identifizierten Optimierungsansätze.

Full text and
other links
PostScript (13605899 Bytes)
Access to students' publications restricted to the faculty due to current privacy regulations
Department(s)University of Stuttgart, Institute of Parallel and Distributed High-Performance Systems, Applications of Parallel and Distributed Systems
Project(s)ORBIT
Entry dateAugust 28, 2001
   Publ. Computer Science