Studienarbeit STUD-1805

Bibliograph.
Daten
Bouillet, André: Realisierung und Optimierung einer Data-Mining-Anwendung.
Universität Stuttgart, Fakultät Informatik, Studienarbeit Nr. 1805 (2001).
116 Seiten, deutsch.
CR-Klassif.H.2.8 (Database Applications)
H.3.3 (Information Search and Retrieval)
H.3.4 (Information Storage and Retrieval Systems and Software)
H.4.2 (Information Systems Applications Types of Systems)
Kurzfassung

In den letzten Jahren ist die täglich anfallenden Menge an Daten kontinuierlich gestiegen. Hieraus entstand das Problem, dass das Informationsangebot für das Unternehmensmanagement zunimmt, und dessen Versorgung mit den entscheidungsrelevanten Daten zunehmend erschwert wird.

Neben OLAP hat sich als eine weitere Möglichkeit Informationen aus diesen großen Datenmenge zu extrahieren, das "Data Mining" entwickelt. Diese Arbeit beschäftigt sich zunächst mit den Grundlagen des Data Mining, insbesondere mit dem Mining-Ablauf und den unterschiedlichen Mining-Algorithmen. Daneben wird die Vorgehensweise zur Implementierung einer Data-Mining-Anwendung mit Hilfe des "Intelligent Miner for Data" von IBM auf bestehenden Daten betrachtet. Hierzu wird die Datenbasis des TPC-H-Benchmarks verwendet.

Weiterer Schwerpunkt dieser Arbeit ist die Untersuchung unterschiedlicher Optimierungsmöglichkeiten auf Datenbankseite zur Beschleunigung der Analyselaufzeiten. Hierzu wird der Einfluß von Implementierungsaspekten, wie die Verwendung von Views, materialisierten Tabellen oder Summary Tables betrachtet. Zusätzlich wird auch auf die Auswirkungen der Attributanzahl der zu analysierenden Relationen eingegangen. Als ein weiterer Punkt wird die Verwendung von Indizes untersucht.

Der Abschluß dieser Arbeit vergleicht die Laufzeiten der zuvor identifizierten Optimierungsansätze.

Volltext und
andere Links
PostScript (13605899 Bytes)
Zugriff auf studentische Arbeiten aufgrund vorherrschender Datenschutzbestimmungen nur innerhalb der Fakultät möglich
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Höchstleistungsrechner, Anwendersoftware
Projekt(e)ORBIT
Eingabedatum28. August 2001
   Publ. Abteilung   Publ. Institut   Publ. Informatik