Bachelorarbeit BCLR-2022-36

Bibliograph.
Daten
Ehlers, Lena: Extraktion von Figurenauf- und -abtritten aus XML-codierten Dramatexten.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Bachelorarbeit Nr. 36 (2022).
60 Seiten, deutsch.
Kurzfassung

Kurzfassung

Dem Nebentext von Dramentexten, zu dem auch Regieanweisungen zählen, ist in der Forschung bislang noch wenig Beachtung geschenkt worden. Vorliegende Arbeit stellt einen regelbasierten Algorithmus vor, mit dem ermittelt wird, ob in den Re- gieanweisungen XML-kodierter deutscher Dramentexte ein Figurenauf- oder -abtritt vorliegt und welche Figuren ggf. davon betroffen sind. Die extrahierten Informatio- nen werden dann automatisch der XML-Kodierung des Dramentextes hinzugefügt. Die bisherigen Evaluationsdaten zeigen ein Makrobewertungs-F1-Maß von über 92% für die Klassifikation in Figurenauf- und -abtritt und über 85% für die korrekte Figu- renerkennung. Demnach eignet sich der in dieser Arbeit vorgestellte Algorithmus für die Anreicherung der XML-kodierten Dramentexte und kann damit als Grundlage für weitergehende Analysen, wie die Kopräsenz von Figuren, genutzt werden.

Volltext und
andere Links
Volltext
Abteilung(en)Universität Stuttgart, Institut für Maschinelle Sprachverarbeitung
BetreuerKuhn, Prof. Jonas; Andresen, Dr. Melanie
Eingabedatum25. Oktober 2022
   Publ. Informatik