Diplomarbeit DIP-1500

Bibliograph.
Daten
Walker, Tilman Patrick: Einsatzmoeglichkeiten Evolutionaerer Algorithmen im Data Mining.
Universität Stuttgart, Fakultät Informatik, Diplomarbeit Nr. 1500 (1997).
166 Seiten, deutsch.
CR-Klassif.H.3.3 (Information Search and Retrieval)
I.2.6 (Artificial Intelligence Learning)
J.1 (Administration Data Processing)
KeywordsEvolutionaere Algorithmen; Data Mining; KDD; Regellernverfahren
Kurzfassung

Evolutionaere Algorithmen arbeiten nach Prinzipien der biologischen Evolution. Sie werden ueberwiegend fuer numerische Optimierungsaufgaben eingesetzt. In der Literatur unterscheidet man zwischen mehreren Unterarten Evolutionärer Algorithmen. Die vorliegende Arbeit beschreibt die Grundprinzipien Evolutionaerer Algorithmen. Die am weitesten verbreiteten Unterklassen werden dargestellt. Mit der Vergroeßerung vorhandener Datenbestaende nimmt auch die Menge der implizit in den Daten vorhandenen Informationen zu. Methoden zur Aufarbeitung und zur Ausbeutung von Datenbanken gewinnen daher an Bedeutung. Der Prozeß zur Extraktion von Information aus Datenbestaenden wird Knowledge Discovery in Databases (KDD) Prozeß genannt. Der Begriff Data Mining steht fuer den Teil des Gesamtprozesses, der aus der Anwendung von Algorithmen zur Informationsextraktion besteht. Es werden ueberwiegend symbolische Verfahren aus dem Bereich des Maschinellen Lernens beim Data Mining eingesetzt. Die vorliegende Arbeit untersucht inwieweit und in welcher Form ein Einsatz Evolutionaerer Algorithmen im Data Mining sinnvoll ist. Einsatzmoeglichkeiten werden aufgezeigt und die erforderlichen Evolutionaeren Algorithmen skizziert. Anhand eines Einsatzes zur Erzeugung bzw. Verbesserung von Regelmengen zur Klassifikation wird ein Algorithmus detailliert entworfen. Der Algorithmus kombiniert Methoden verschiedener evolutionaerer Ansaetze. Er kann sowohl unabhaengig als auch als hybrides System in Zusammenarbeit mit Regellernsystemen (z.B. C4.5) eingesetzt werden. Der Algorithmus wurde implementiert und in das kommerzielle Data Mining System "Clementine" integriert. Es wurden umfangreiche Experimente zur Beschreibung des Algorithmusverhaltens durchgefuehrt. Der Algorithmus verbessert die von C4.5 (Quinlan) erzeugten Regelmengen in bezug auf Klassifikationsgenauigkeit. Mit zufaelliger Initialisierung (ohne Zusammenarbeit mit C4.5) erreicht der Algorithmus zu C4.5 vergleichbare Klassifikationsergebnisse. Die Wirksamkeit der eingesetzten Operatoren und die Auswirkungen verschiedener Selektionsarten wurden untersucht.

Volltext und
andere Links
PostScript (3494247 Bytes)
Zugriff auf studentische Arbeiten aufgrund vorherrschender Datenschutzbestimmungen nur innerhalb der Fakultät möglich
Abteilung(en)Universität Stuttgart, Institut für Informatik, Formale Konzepte
Eingabedatum31. Juli 1997
   Publ. Informatik