Forschungsschwerpunkte

(aus: IfI-Jahresbericht 1993)

Überblick

Das Tätigkeitsfeld der Abteilung liegt im Bereich der symbolverarbeitenden KI, auf den Gebieten Wissensrepräsentation, Sprachverarbeitung und Maschinelles Lernen. Generelles Ziel der Arbeiten ist es, prinzipielle und praktikable Wege für den Erwerb und Einsatz begrifflichen Wissens in Rechnersystemen zu erkunden, um damit einen Beitrag zur Steigerung der qualitativen Leistungsfähigkeit und Benutzungsfreundlichkeit von Rechnern zu leisten.

Forschungsberichte und Papiere

Wissensrepräsentation mit FrameTalk

Christian Rathke

FrameTalk ist eine frame-basierte Repräsentationssprache, die als Erweiterung von CLOS, dem objekt-orientierten Teil von Common Lisp, entwickelt wird. Die Erweiterungen sind im Sinne objekt-orientierter Konzepte realisiert, d.h. sie haben selbst die Form von Klassen, Instanzen und Methoden. Objekte in FrameTalk bestehen aus einer Reihe von ``Perspektiven''. Perspektiven sind Inkarnationen ein und desselben Objektes in unterschiedlichen Kontexten. So kann eine Person als Arbeitnehmer und in anderen Kontexten als Arbeitgeber, Reisender, Musiker, etc. fungieren. Perspektiven heben einen Teil des repräsentierten Objekts hervor. Sie werden damit auch vom Betrachter bestimmt. Darüberhinaus tragen sie zur Definition von Objekten und deren Eigenschaften bei. Die Beschreibung von Individuen im assertionalen Teil einer Termbeschreibungssprache führt üblicherweise zur Zuordnung mehrerer Terme des terminologischen Teils. Es liegt nun nahe, solche multiplen Beschreibungen als Perspektiven aufzufassen und das gegebene Individuen allen Beschreibungen zuzuordnen. Um solche und verwandte Modellierungsmöglichkeiten mit Perspektiven zu untersuchen, wurde eine einfache Termbeschreibungssprache realisiert und um Perspektiven ergänzt.

Modellierung verfahrenstechnischer Prozesse

Christian Rathke

In Kooperation mit dem Institut für Systemdynamik und Regelungs- technik (ISR) wird FrameTalk für die Modellierung verfahrenstechnischer Prozesse eingesetzt. Als Beispiel für die Repräsentation von Modellbausteinen wurde ein Einphasen- Flüssigkeitsbehälter modelliert und damit die prinzipielle Eignung von Frame-Talk für die Behandlung von Ingenieurproblemen gezeigt. Die Zusammenarbeit soll kontinuierlich fortgeführt werden.

Wissensrepräsentation und Sprachverarbeitung

Peter Forster, Gerrit Burkert

Ziel der Arbeiten sind realistische Verfahren für Wissensverarbeitung und inhaltsorientiertes Sprachverstehen. Hierzu wurden terminologische und assertionale Repräsentationsansätze, die sich durch eine klar definierte modelltheoretische Semantik auszeichnen, auf ihre Eignung hin untersucht, geeignet weiterentwickelt, und in einem selbst implementierten Softwaresystem für Experimente verfügbar gemacht. Der terminologische Formalismus TED (TErm Description language) geht zurück auf das Wissensrepräsentationssystem KL-ONE. Er dient zum Aufbau einer Taxonomie von Konzepten. Mit Hilfe der assertionalen Komponente ALAN (Assertional LANguage) werden Aussagen über Konzeptausprägungen formuliert. Im Berichtszeitraum wurde das Wissensrepräsentationssystem um eine Komponente zur Verarbeitung von Regeln erweitert, die es erlaubt, zusätzliche Instanzbeziehungen aus der Wissensbasis abzuleiten. Ein abhängigkeitsgesteuertes Backtracking ermöglicht es, in die Wissensbasis eingetragene Fakten wieder zu löschen. Dabei werden alle auf diesen Fakten basierende Inferenzen zurückgenommen. Zum inkrementellen Aufbau eines umfangreichen Bestandes an Weltwissen sollen robuste Verfahren der inhaltsorientierten Sprachverarbeitung der Einsatzreife nähergebracht werden. Die Weiterentwicklungen des Berichtszeitraums betreffen:

Sprachverarbeitungskomponenten und Wissensrepräsentationsmodule wurden in einem ersten experimentellen Textprozessor integriert, der am Beispielbereich der natürlichsprachlichen Abfrage einer geographischen Wissensbasis erprobt wurde.

Sprachbeschränkungen in der Induktiven Logischen Programmierung

Birgit Tausend

Die meisten maschinellen Lernverfahren verwenden induktive Inferenzschritte, um Hypothesen zu generieren. Anstatt Fakten deduktiv aus einer gegebenen Theorie herzuleiten, wird eine Theorie aus gegebenen Beispielfakten induziert. Die Induktive Logische Programmierung (ILP) beschränkt Beispiele und die Zieltheorie auf Hornlogik erster Stufe. Damit gehört sie zu den mächtigsten induktiven Inferenzmechanismen, die derzeit untersucht werden. Diese Mächtigkeit führt zu einem unendlichen Suchraum möglicher Zieltheorien, der stark beschränkt werden muß, um handhabbar zu sein. Die Beschränkung auf funktionsfreie Hornlogik oder auf Klauseln einer durch Schemata beschriebenen syntaktischen Form sind Beispiele solcher Suchraumbegrenzungen. Solche Einschränkungen können auf verschiedene Arten repräsentiert werden, z.B. durch Regelschemata, Abhängigkeitsgraphen, Grammatiken oder Klauselmengen. Um die verschiedenen Einschränkungen ausdrücken zu können, wurde eine einheitliche Repräsentation CTL entwickelt, die die deklarative Formulierung von Sprachbeschränkungen ermöglicht. CTL wurde dazu verwendet, verschiedene Beschräkungen zu evaluieren und die Auswirkung neuer Kombinationen auf die Größe des Hypothesenraums zu untersuchen. CTL wurde in das System MILES integriert, wo es den den Suchprozeß und die Erweiterung der Hypothesensprache unterstützt. MILES ist ein Rahmenprogramm für die Induktiven Logische Programmierung, das an der Universität Stuttgart von Irene Stahl, Birgit Tausend, Bernhard Jung (Diplomarbeit), Markus Müller (Studienarbeit), Thorsten Volz (Studienarbeit) und Irene Weber (Studienarbeit) entwickelt wurde. MILES enthält eine Reihe bekannter Heuristiken, Spezialisierungs- und Generalisierungsoperatoren, die einfach kombinierbar sind, so daß bekannte Systeme simuliert und neue entwickelt und getestet werden können.

Einführen neuer Prädikate in der Induktiven Logischen Programmierung

gefördert durch ESPRIT BRA 6020: Inductive Logic Programming

Irene Stahl

In der Induktiven Logischen Programmierung ist eine unabhängig von der syntaktischen Form gegebene Suchraumbegrenzung das Vokabular, d.h. die vorhandenen Funktions- und Prädikatsymbole, die in den Hypothesen verwendet werden sollen. Es bestimmt, ob eine korrekte Hypothese leicht, schwer oder überhaupt nicht gefunden werden kann. So ist zum Beispiel das Prädikat schwiegertochter leicht zu lernen, wenn das Prädikat schwiegerelter bekannt ist, schwerer nur, wenn die Prädikate elter, verheiratet, männlich und weiblich bekannt sind, und gar nicht, wenn nichts über die bestehenden Ehen bekannt ist.

Ist das Vokabular für eine Lernaufgabe zu beschränkt, kann das Einführen eines neuen Prädikates Abhilfe schaffen. Die Untersuchung dieses Problems und das Entwickeln dafür geeigneter Mechanismen stellen den Stuttgarter Beitrag zum ESPRIT Projekt 6020 ``Inductive Logic Programming'' dar.

Drei Hauptprobleme treten auf, wenn das Vokabular eines ILP-Systems erweitert werden soll:

Die bisherige Arbeit hat sich auf die erste Fragestellung, die Entscheidungskriterien für die Erweiterung des Vokabulars, konzentriert. Für verschiedene Sprachbeschränkungen wurden die Entscheidbarkeit des Problems und die Nützlichkeit neuer Prädikate als Mittel, den Lernerfolg zu ermöglichen, theoretisch untersucht.

Das Rahmenprogramm zur induktiven logischen Programmierung MILES wurde um eine generische Kontrolle erweitert, die erlaubt, mit verschiedenen Kriterien und Heuristiken zur Einführung neuer Prädikate zu experimentieren. Erste Tests mit einfachen Sprachbeschränkungen zeigten, wie leicht die Parameter der generische Kontrolle mit den vorhandenen Operatoren instantiiert werden können, aber auch, welche speziellen Suchprobleme im Zusammenhang mit neuen Prädikaten auftreten.

Erschließung von Textkorpora - Werkzeuge und Methoden

gefördert vom Land Baden-Württemberg im Rahmen des Forschungsschwerpunktprogramms

Oliver Wauschkuhn, Egbert Lehmann,

Im Rahmen eines vom MWF Baden-Württemberg geförderten Forschungsprojekts werden zusammen mit den Partnern IMS (Institut für maschinelle Sprachverarbeitung) und ILR (Institut für Linguistik-Romanistik) Werkzeuge entwickelt und implementiert, mit denen umfangreiche Textmengen (Textkorpora) auf das Vorkommen bestimmter sprachlicher Muster untersucht werden können. (Beispiel: Wie oft tritt im Korpus das Wort `wegen' gefolgt von einer Nominalphrase mit Genitiv-Kasus auf?)


O. Wauschkuhn / Juni 1996