Komplexität von Hypothesenräumen in der Induktiven Logischen Programmierung

Diplomarbeit Nr. 1164



Zusammenfassung

Die Induktive Logische Programmierung (ILP) ist ein Teilgebiet des Maschinellen Lernens. Charakteristisch für die Ansätze der ILP ist unter anderem die Verwendung eines prädikatenlogischen Formalismus zur Repräsentation der Hypothesen. Diese prädikatenlogischen Hypothesensprachen sind im allgemeinen sehr ausdrucksmächtig, führen jedoch auch zu sehr umfangreichen Suchräumen. Die verschiedenen Ansätze der ILP verwenden daher mehr oder weniger starke Einschränkungen der Hypothesensprache, um den Suchraum zu begrenzen.

In dieser Arbeit wird die Komplexität der Hypothesenräume für die ILP-Systeme FOIL [1], FOCL und CLINT untersucht. FOIL lernt in einem sehr umfangreichen Hypothesenraum, der mit einer heuristischen Bergsteige-Strategie durchsucht wird. FOCL, einer Erweiterung von FOIL, werden verschiedene Einschränkungen der Hypothesensprache verwendet, um den Hypothesenraum zu begrenzen. Der Hypothesenraum des Systems CLINT wird durch parametrisierte Sprachen definiert, die in Sprachreihen angeordnet sind. Für diese Systeme werden Abschätzungen entwickelt, die es erlauben, die Komplexität ihrer Hypothesenräume zu beurteilen. Der Einfluß verschiedener Einschränkungen der Hypothesensprache auf die Komplexität des Lernens in FOIL und FOCL und die Wirkung der Parameter in den Sprachserien von CLINT werden untersucht mit dem Ziel, wirkungsvolle Beschränkungen von ungeeigneten zu unterscheiden. Als Ergebnis dieser Untersuchungen wird eine neue Sprachserie vorgeschlagen, in der einige Schwächen der in CLINT verwendeten Sprachserien behoben sind. F Außerdem wird gezeigt, wie die Hypothesensprachen der behandelten Systeme mit den Ausdrucksnmitteln der Klauselbeschreibungssprache CTL [4] dargestellt werden können. Diese Sprache ist ein einheitlicher Repräsentationsformalismus für in der ILP geläufige Einschränkungen der Hypothesensprachen.


  1. Quinlan, J.R. Induction of Decision Trees. Machine Learning 1, 1986.
  2. Pazzani, M., und D. Kibler. The Utility of Knowledge in Inductive Learning. Machine Learning 9(1), 1992.
  3. De Raedt, Luc. Interactive Theory Revision. Academic Press, London, 1992.
  4. Tausend, Birgit. Beschränkungen der Hypothesensprache und ihre Repräsentation in der Induktiven Logischen Programmierung. Dissertation, Universitäat Stuttgart, 1994.

I. Weber / weberi@informatik.uni-stuttgart.de