Bachelor Thesis BCLR-2019-28

BibliographyWerner, Peter: Automatische Zusammenfassung eines Newsletters mithilfe von Text-Mining.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Bachelor Thesis No. 28 (2019).
103 pages, german.
Abstract

In der heutigen Zeit stehen große Informationsmengen in Form von digitalisierten Texten zur Verfügung. Allerdings sind diese meist unsortiert abgelegt und das Auffinden bestimmter Texte, sowie das Gewinnen eines Überblicks über den vorliegenden Datenbestand, geht mit großem manuellem Aufwand einher. Im Rahmen dieser Arbeit wurde ein Prototyp für ein System entwickelt, das den Menschen durch automatische Kategorisierung, Zusammenfassung und Erfassung von Eckdaten bei diesen Aufgaben unterstützen soll. Für die Kategorisierung wurde der Online-Hierarchical-Dirichlet-Process (oHDP) zur Erkennung latenter Themen, für die Zusammenfassung der TextRank-Algorithmus und für die Erfassung der Eckdaten ein naiver Bayes-Klassifikator eingesetzt. Als Informationsbestand dienten dazu Artikel aus wöchentlich veröffentlichten Newslettern. Die anschließende Evaluation des Prototyps zeigt, dass er Nutzern helfen kann, einen Überblick über die Informationen zu erhalten. In Zukunft sind aber noch weitere Verbesserungen nötig, um das System produktiv einzusetzen.

Department(s)University of Stuttgart, Institute of Software Technology, Software Engineering
Superviser(s)Wagner, Prof. Stefan; Ebert, Verena; Vehlow, Dr. Corinna; Black, Melanie
Entry dateAugust 7, 2019
   Publ. Computer Science