Technischer Bericht TR-2002-06

Bibliograph.
Daten
Lagally, Klaus; Rzehak, Lutz: Ein Satz von Komponenten zur nachhaltigen Verwaltung und Umwandlung von frei formatierten Woerterbuchdaten.
Universität Stuttgart, Fakultät Informatik, Fakultätsbericht Nr. 2002/06.
35 Seiten, deutsch.
CR-Klassif.E.2 (Data Storage Representations)
J.5 (Arts and Humanities)
H.5.2 (Information Interfaces and Presentation User Interfaces)
I.7.2 (Document Preparation)
Kurzfassung

Wir schlagen vor, bei der Verarbeitung linguistischer Informationen die Darstellung der Daten anwendungsunabhängig zu halten und die spätere Verarbeitung davon strikt zu trennen. Wir erreichen damit nicht nur eine strenge Arbeitsteilung, sondern auch flexible Wiederverwendbarkeit. Wir demonstrieren das Konzept an einem einfachen, aber repräsentativen Prototyp eines mehrsprachigen Wörterbuches in unterschiedlichen externen Darstellungen, die aus derselben Wissensbasis gewonnen werden. Dabei zeigt sich, daß für die Ablage der Daten sowohl eine Codierung im TeX-Format wie auch eine XML-Darstellung gleichermaßen in Frage kommen, und daß sich die weiteren Auswertungen und Umwandlungen, zumindest wenn man TeX als universelle Plattform verwendet, in sehr komfortabler Weise kombinieren lassen.

Volltext und
andere Links
PDF (152759 Bytes)
PostScript (461306 Bytes)
CopyrightKlaus Lagally
Kontaktlagally@informatik.uni-stuttgart.de
Abteilung(en)Universität Stuttgart, Betriebssoftware
Projekt(e)MLDICT
Eingabedatum16. September 2002
   Publ. Informatik